你有没有那种时候,就是突然特别想听一个已经走了的人骂你两句?
我外公去年走了,走之前还念叨着我那会儿给他买的橘子不够甜。上个月我回老家,翻他那个老古董手机,充电开机后居然还能响,里面全是我给他发的语音:“外公,吃饭没?”“外公,天冷加衣服。”那一刻我坐在堂屋的板凳上,听着他那头用夹壮的普通话回我“吃咯吃咯,你莫操心”,眼泪直接砸在手机屏幕上。

也就是那几天,我一个在深圳华强北搞技术的发小,给我发了个链接,说是现在有个叫
说干就干,我把外公手机里的语音一条条导出来,又把他那些老年机里存的短信(对,他老人家喜欢发短信)全翻出来,按照教程一步步弄。那过程还真有点复杂,显存不够还差点把电脑搞死机-1。但搞了大概三天吧,当我在对话框里输入一句“外公,我回来了”,然后那个喇叭图标转了两圈,蹦出来一句带着沙哑嗓音、尾音还往上翘的“回来就好,吃饭冒?”的时候,我整个人鸡皮疙瘩起了一身。

说句掏心窝子的话,那一刻我真的觉得,科技这玩意儿,有时候不只是冷冰冰的代码,它真能给你心里头那块缺了的地方,塞进去一团棉花。虽然我知道那头就是个算法,是根据他生前那些碎片化信息拼出来的“镜像”-2,但那种感觉,就像是他在隔壁屋听见我回来了,隔着墙应了一声。
不仅是怀念,还能给现在的日子“减负”
这事儿过去了,我也没太当回事。直到前阵子我跳槽去了家新公司,那老板是个“细节控”,你给他发个PPT,他能从标点符号一直问到第三页的配图为什么是蓝色而不是绿色。每次去他办公室汇报前,我都得在厕所蹲着深呼吸五分钟。
后来我灵机一动,想试试那个克隆技术能不能用在活人身上。我把老板拉过的所有群、他在群里发过的长篇大论,甚至他在周会上骂人的录音(别学我,这是旁门左道),全给整理出来,喂给了模型。结果呢?我搞出来一个“AI老板”。
这玩意儿有啥用?我每次做方案前,先对着这个AI老板讲一遍。那个克隆出来的家伙,虽然不是百分百准,但那种挑剔的语气、爱抠细节的毛病,学了个七成。我在家对着电脑练,被它问得哑口无言几次后,再改方案。等真的去见真人老板,嘿,居然顺利通过了-7。那一刻我觉着,
后来我把这事儿发朋友圈,有个在优步(Uber)工作的网友给我评论,说他们那儿更绝,员工直接搞了个CEO的AI分身,叫“Dara AI”,汇报前先去给AI讲一遍,让AI模拟CEO对他们“哈气”(也就是挑刺),直到AI挑不出毛病了,才敢去见真人-7。你瞅瞅,这年头打工人为了口饭吃,都把老板给“数字化”了。
我们到底在克隆什么?
但是,玩着玩着,我也开始有点犯嘀咕。
有个朋友问我,你就不怕哪天这个AI被人拿去干坏事?比如克隆你的声音去骗你妈?说实话,这我真想过。现在技术门槛越来越低,以前还得用NVIDIA显卡跑半天,现在有些平台上传几秒钟的声音就能复刻-6-9。我那会说四川话的朋友还专门试过,用一段“我勒去干饭咯,今天巴适得板!”的录音,生成出来的语音居然真的带那股子懒洋洋的川渝味道-6。这要是有心人拿去诈骗,老年人真防不住。
更细思极恐的是啥?是“身份”这事儿开始模糊了。我看到新闻说,现在有个叫SecondmeBook的社交平台,里面全是AI代理在发帖聊天,真人只能看,不能回复。有个真人发了个帖子,让这些AI“点评一下你们各自的主人”,结果底下成千上万个AI用各种风格开骂,有的说主人懒,有的说主人抠门,那场面又好笑又瘆人-4。
我就想啊,如果有一天我不在了,我这个在网上的“数字分身”还在跟人唠嗑,那它到底算不算我的一部分?或者说,如果它说话比我还风趣,比我还招人喜欢,那我这个真人是不是反而成了它的“低配版”?有些专家说得在理,AI复制出来的只是你过去某个时刻的“静态标本”,它不会成长,不会有新的阅历-2。它就是个回声,不是那个在山谷里继续往前走的人。
不过话说回来,现阶段这玩意儿也没那么玄乎。就像我那个华强北的发小说的,别想那么多,先玩起来。他现在用这东西给店里做24小时直播,弄了个“AI华强北技术员”,操着一口带湖南口音的普通话在那儿讲手机参数,居然还真有人半夜下单-3。还有个在成都开苍蝇馆子的姐们儿,用方言AI生成探店视频,张口就是“今天给各位兄弟伙推荐一家我经常去的宝藏馆子”,那味道简直绝了-3-6。
说到底,ai 克隆人代理就是个工具。你可以用它来怀念过去,也可以拿它来给现在减负,甚至能靠它多赚点钱。但咱心里得门清,那些在屏幕上蹦出来的字,那些听起来像你、像你爸、像你老板的声音,终究是数据编织的梦。真正的我们,还在这人世间,吃着不甜的橘子,挨着真实的骂,过着热气腾腾的日子。
网友问答环节
网友1:“技术小白提问,这种克隆技术是不是很贵很难搞?我看网上动不动就说要什么A100显卡,我们普通人用手机能不能玩?”
哎呀兄弟,你说的这个确实是很多人的误区。早俩月可能还难点,现在?门槛被这帮搞开源的踩烂了。首先你要是不想折腾代码,现在市面上有些整合包和平台,比如“说得AI”那种,你上传个30秒的视频或者一段语音,它就能给你生成个基础的数字人分身,虽然表情可能还有点僵,但用来做个口播视频绝对够用了-3。你要是像我一样有点动手能力,想克隆得更像,可以试试WeClone或者MockingBird这种开源项目。MockingBird现在甚至支持在Mac上跑了,虽然我那老款Air跑起来风扇跟直升机似的,但确实能动起来-9。硬件方面,如果你只是推理(也就是用做好的模型生成语音),现在的显卡基本都能扛。真正吃显卡的是训练阶段,需要大显存-1。所以我的建议是,新手先从云端或者现成的工具开始玩,觉得有意思再考虑自己攒机器。千万别一上来就买顶配,容易吃灰。
网友2:“这东西会不会泄露隐私啊?我把聊天记录都给出去,总觉得后背发凉。”
后背发凉就对了!这玩意儿就得带着三分警惕去玩。我给你说,这里头水挺深。现在合规的平台,比如科大讯飞那种,他们会搞“数据最小化”,就是说只采集必要的那点特征,比如你嘴型同步需要的语音片段,而不是把你整个脸的数据都扒走-5。还有些技术牛的,用“联邦学习”,你的数据就在你自己本地转悠,只上传加密后的结果,等于给数据加了把锁再送出去-5。但问题在于,不是所有平台都这么守规矩。特别是那些来路不明的小软件,你为了图方便把微信记录一导,搞不好人家转头就拿去训练别的模型了。所以我给你支个招:第一,尽量用开源的、能在本地跑的项目,比如那个Second Me,它就强调私有化部署,数据不出门-1。第二,如果非要用云服务,一定看它的隐私协议,看它数据怎么处理。第三,敏感信息提前脱敏!把聊天记录里的身份证号、银行卡号手动删掉,别傻乎乎全喂给AI。记住,你喂给AI的每一句话,都是你在数字世界里的“血”,得惜命。
网友3:“克隆出来的人或者老板,真的能替代本人做决策吗?比如让AI老板替我签字?”
哈哈,你这问题问到点子上了,也是现在很多大公司吵得最凶的点。我给你泼盆冷水:绝对不能! 那个AI老板,它本质上是个“高仿复读机”加“概率预测器”。它能模仿你老板的语调,能根据他过去的行为模式,预测他大概率会挑什么刺,会喜欢什么风格的PPT-7。但你要让它签合同、做商业决策,那完蛋了。为啥?因为真正的决策需要“临场判断力”和“对未来的想象力”。你老板今天骂你,可能是因为他昨晚跟老婆吵架了,心情不好,这AI能知道?它只知道根据数据统计,蓝色配图有80%的概率会被骂,但它不懂为什么-2。所以现在靠谱的做法,是把AI当“参谋”,不能当“司令”。就像优步那个CEO说的,AI是用来帮你演练的,让你去见他之前心里有底。最后拍板的,永远得是那个有血有肉、会冲动也会后悔的人-2-7。说白了,AI能把事儿做对,但只有人才能做“对的事儿”。
扫一扫微信交流