DeepSeek的胡编乱造,正在淹没中文互联网
创始人
2025-03-05 13:09:12

文 | 阑夕

虽然DeepSeek-R1确实好用,但它在爆火之后,成了人手一个的AI工具,也对中文互联网的信息环境造成了严重的污染情况,这是一个固然难以避免但也理应得到重视的问题。

最近一个星期以来,就我看到的刷屏文章,至少有三例都是DeepSeek-R1生成出来的、充满了事实错误的内容,却因其以假乱真的迷惑性,让很多朋友信以为真,情绪激动的分享传播。

第一例,是知乎的这条高赞回答:

即使在我指出来之后,依然有人不可置信的表示,看不出来其中的「AI味」,所谓的「AI味」,指的是DeepSeek-R1创作文本时特有的「极繁主义」,比如生造概念、堆叠名词、滥用修辞等等。

而这条知乎回答,或因提示词喂得好,或因后期润色得力,在很大程度上消除了它的「AI味」,但从表达结构上,经常和AI打交道的用户都能一眼看出痕迹,纯正的DeepSeek-R1风格,当然普通人确实难以识别。

不过我也不是直接得到这个结论的,在看到朋友分享这条回答时,我原本也和他一样,是带着对于国产动画电影崛起的兴奋全盘接受了如此言之有物的论证,直到一个致命的纰漏让我察觉到了不对劲。

作者说哪吒电影里的敖丙变身镜头在法国昂西动画节上轰动业界,问题是,法国是有一个昂西动画节,哪吒的电影也是送去参展过,但那是追光动画出品的「哪吒重生」,而不是饺子导演的「哪吒」……

而且因为审核原因,这部送展的「哪吒重生」宣传片实际上是一部品牌概念片,内容是在一个现代都市里的赛车动作演示,哪吒根本就没出现,更不存在敖丙的变身……

继续查证也能发现,关于「哪吒」的制片方给员工分成都房子、攻克水下流体特效之类的描述,全都是DeepSeek-R1为了完成这篇命题作文自己脑补的。

第二个例子,就更离谱了,离谱到我不太能把完整截图发在这里,因为有些胆子够粗的自媒体,已经在拿DeepSeek去写涉军涉政的东西了。

其中有一篇写军工打虎谭瑞松的选题,标题是《军工虎谭瑞松, 从“道德标兵”到“猎艳狂魔”,“国之重器”沦为私人金库》,原文现在已经被删了,应该是被被转得太广作者害怕了,但很多「金句」的截图还在到处传,什么直升机的设计图纸在暗网里开价200比特币出售、收受金条贿赂时要求熔成发动机叶片形状、某总师离职时留言这里不是造飞机的地方而是造孽的工厂等等,如果你能记得这些细节,就一定知道我说的是哪篇文章。

不好意思,这也全都是DeepSeek-R1自己编的。

为什么我能确信是DeepSeek-R1的手笔呢?为什么不能是ChatGPT、Claude、文心一言?因为DeepSeek-R1是当前唯一能用的免费推理模型,且对中文的支持度足够高,这本来是DeepSeek-R1的优势,只是没被用在正道上。

此时就需要补充一个推理模型的特点了,那就是推理模型的训练过程特别注重奖惩机制,通过思维链的暴露我们也能看出它通常都会想得缜密、生怕自己没有摸清用户意图,以致于经常到了「谄媚」的程度。

这种训练模式的好处在于,可以让推理模型拥有举一反三的能力,能够更加灵活和完善的去完成任务,但是相对的,为了完成任务,推理模型也会在「不自知」的情况下,同时表现出欺骗性,当用户要求它写一篇作文时,哪怕缺少论据,它也会为了不辜负用户的指令,去自行编造一些材料出来,以便于自圆其说。

这就是大模型行业至今仍在致力于解决的「幻觉」现象。

上图就是一个经典用例,用户为DeepSeek-R1设立了阿里估值逻辑改变的靶心,于是DeepSeek-R1就逼迫自己去对着靶心射箭——它不会也不能反驳用户,或是质疑阿里的估值逻辑到底变没变——于是就「情不得已」的编造出了可以用来证明用户观点的数据。

根据Vectara发布的大模型幻觉排行榜,DeepSeek-R1的幻觉率达到了14.3%,远高于Deepseek-V3的3.9%,也在所有主流模型里属于较差的一档。

按理来说,R1是比V3更新、更强大的模型版本,之所以反而表现得更加拉垮,还是因为推理模型比普通模型先天就更加具有「创造力」,其实在AI研究领域,幻觉本身并不是单纯的缺点,甚至可以说,幻觉就是科学家们希望在AI身上看到的所谓意识,只是我们还没有把AI调教得当,让它在该天马行空的时候自由创作,在该遵守事实的时候有理有据。

所以我的这篇文章也不是在说DeepSeek-R1有问题,而是滥用它来批量化生成真假难辨的信息、并海量投放到公网的这种行为,问题很大。

越是公共讨论聚集的地方,比如时政、历史、文化、娱乐等领域,越是重灾区,这和自媒体的商业模式有关,有流量就有收入,流量取决于内容的吸引力,同时内容又受到生产成本的限制,而当DeepSeek-R1这种降维打击的武器被交到了每一个人手里,失控就是不可避免的了。

第二个例子里的作者大概是察觉到流量太高也容易出事,已经会在新的文章里——依然都还是DeepSeek-R1写的——加上一条下面这样的声明,不过只能说聊胜于无,很少有人会注意到并理解这句话的意思——上面的内容有一半是我编的,但我不告诉你们是哪一半。

事实上作者也确实不知道DeepSeek-R1交稿的内容里哪些是真哪些是假,他可能会提供一些参考资料,以及开放全网搜索的权限,但就像我说的,推理模型的运作模式,决定了它不是简单的洗稿,而是会自行完善故事的骨架和细节,最后的结果就是真假参杂,迷惑性反而更大了。

第三个例子,是历史博主知北遊的豆瓣记录,简单来说,是有人拿虚构的历史材料,布局七天来钓他上钩,如果不是他本身具有很强的反诈意识,加上三次元有人脉关系进行证伪,他一定会继续沉迷在这个局里,这个局的破绽在于AI搞错了两个历史人物的死亡顺序,打破了他在发现新的史料上如获珍宝的兴奋感。

一直以来,文史圈都是AI污染的重灾区,因为有大量的文献材料还没有数字化,可用的网络资源有限,考据成本很高,但凡较真起来,都会陷入「造谣一张嘴、辟谣跑断腿」的困境。

就,真的很让人焦心,用AI解决自己的问题是一码事,将AI杜撰的信息混到公网里又是另一码事了,当在这些言之凿凿的内容成为互联网信息库的一部分之后,甚至又会被AI重新咀嚼回去训练,事实数据和生成数据之间的界限将会更加模糊,这绝对不是一件好事。

有人可能会问,在没有AI的时候,人类也会造谣,也会发到网上到处都是,怎么没见到你这么痛心疾首?

其一,「抛开剂量谈毒性都是耍流氓」,AI的工业化生产能力,和个体户的伏案写作流程,在效率上是天差地别的,实际上在我写这篇文章以前,搜索引擎、线上文库、各类网站上的AI填充情况就已经非常不堪了,在有了推理模型——精通于一本正经的胡说八道——之后,整个污染趋势会向深处蔓延,从相对次要的资料层触及创作上游的信源层,覆水难收;

其二,人类造谣起来是有局限性的,比如他不可能出现在一个自己没理由出现的场合,真要这么编造起来很容易露馅,但AI则会脸不红心不跳的直接生造,比如栩栩如生的细节,或是身临其境的描写,在说谎这件事情上,AI的主观恶意或许不及人类,但它的发挥能力,却是独一档的;

其三,AI内容的生产者一般都是营销号,而为内容背书的,则是传播者的信誉,比如大V博主上钩后的转发分享,通过这种扩散机制,实现从寄生到合理化的存在目标,才是最可怕的,人会爱惜羽毛,会知道信誉下滑的后果,但营销号不在乎,只要避开敏感话题,有太多的流量可以消费,尤其是在掌握了「创造」独家信息这个技术之后;

其四,AI的便利性已经把虚假信息的泛滥推到了生活的各个方向,有人拿着它推荐的菜单去点菜结果发现店里没这个菜,有人拿着旅游攻略发现当地根本没这个景点,经我实测它还会捏造不属于「山海经」的古典异兽。

我想说的是,AIGC是技术发展的未来,DeepSeek也是国产模型的翘楚,工具没有错,错的是滥用、恶用工具的行为,AI当然可以创造内容,但前提一定要是注明它由AI生成,不能鱼目混珠,放任它以一种不可辨识的方式成为互联网的原生信息,大模型厂商和内容平台也有义务把类似数字水印那种兜底方案同步推进起来,每迟一天,治理成本都会几何级的变得更高。

相关内容

热门资讯

成华区文化创意产业协会秘书长姜... 7月11日,中共成都市委十四届七次全会召开,成都市成华区文化创意产业协会秘书长姜凯雯接受红星新闻记者...
英伟达市值一度破4万亿美元 人... 新华社北京7月10日电 美国芯片制造商英伟达公司的股票价格9日在盘中交易中一度冲高至每股164.42...
航天电子跌0.20%,成交额4... 7月10日,航天电子跌0.20%,成交额4.42亿元,换手率1.34%,总市值331.58亿元。 异...
ETF今日收评 | 稀土相关E... 市场全天冲高回落,三大指数小幅上涨。从板块来看,稀土永磁概念股集体爆发,券商、互联网金融概念股一度冲...
ESG年报解读|携程集团披露碳... 资料来源:携程集团2024年度可持续发展报告 编者按:ESG年报解读为搜狐财经及价值公司100联合发...
地通工业更换券商重启IPO辅导... 瑞财经 王敏 7月11日,地通工业控股集团股份有限公司(以下简称“地通工业”)在湖南证监局启动IPO...
飞书CEO谢欣称拿不下京东:大... 据晚点,在回答"有什么大客户是你一直想拿但没拿下来的"问题时,飞书CEO谢欣表示:"还是有的,比如京...
北京豪华公寓“量增价跌”、二季... 7月10日,仲量联行发布《2025年上半年北京房地产市场回顾》。报告显示,2025年第二季度,北京办...
银行板块盘中走弱,浙商银行领跌... 7月11日,银行板块盘中下跌1.5%,浙商银行领跌2.64%,华夏银行、民生银行、青农商行、张家港行...
ETF盘中资讯|英伟达市值站稳... 或由于英伟达登顶4万亿市值,“AI 投资热”再升温!今日(7月11日),重点布局国产AI产业链的科创...
香港高息ETF受追捧,收益最高... 随着美国总统特朗普实施关税政策带来不确定性,部分投资者忧虑下半年股市波动,并希望寻求具备稳定现金流及...
2025年上半年上市公司重组市... 来源:市场资讯 2025年已过半,距离“并购六条”颁布也过了9个月,这期间A股上市公司并购重组市场焕...
24小时环球政经要闻全览 | ... 特朗普吹嘘政绩 继续施压美联储降息 美国总统特朗普在社交媒体上表示:科技股、工业股、纳斯达克指数创历...
原创 7... 欧盟雷霆风暴:7亿欧元走私案震动中欧贸易 凌晨的希腊比雷埃夫斯港,警笛声划破宁静,如同宣告一场风暴的...
机器人ETF易方达(15953... 截至中午收盘,国证机器人产业指数(980022)涨0.96%,权重股中,汇川技术涨1.8%,科大讯飞...
华润、青岛、百威亚太:高盛下调... 【7月10日高盛下调中国啤酒行业今年销量及均价增长预测】7月10日,高盛发布研究报告,短期内对中国啤...
特朗普称赞英伟达股价 呼吁美联... 当地时间7月10日周四上午,美国总统特朗普在社交媒体平台TruthSocial“真实社交”上发文,再...
1.1万亿ETF背后有个大坑,... 看到有新闻报道,南京的盛夏,金融圈的精英们挤满了深交所的会场。台上专家侃侃而谈ETF定投的种种妙处,...
瑞幸大股东或竞购星巴克中国股权 记者丨贺泓源 刘瑾睿 编辑丨张伟贤 星巴克中国股权出售继续推进中。 2025年7月9日,据多家媒体援...
放量937亿元!“牛市旗手”集... 今天(7月11日)早盘,A股三大指数集体高开。截至早盘收盘,沪指、创业板指双双涨超1%,深成指涨0....
中国平安:7月10日融券卖出3... 证券之星消息,7月10日,中国平安(601318)融资买入3.26亿元,融资偿还4.68亿元,融资净...
淘宝闪购激发消费活力 食品饮料... 本报讯 (记者梁傲男)自淘宝闪购上线以来,社会消费热情被极大点燃。暑期经济激活了食品饮料及餐饮消费,...
上交所:华数数字电视传媒集团有... 7月11日,上交所发布关于华数数字电视传媒集团有限公司2025年面向专业投资者公开发行公司债券(第三...
比特币突然狂飙,超19万人爆仓... 隔夜美股盘中突然拉升。加密货币集体大涨,比特币一度突破117000美元。 周四美股盘中反弹,至收盘纳...
卷跑130亿,许家印都自叹不如 卷走130亿不稀罕,稀罕的是被他跑了。 在咱们这里要找进步最快的领域,“人传人”式营销可能得算上一...
多数投资机构看好A股后市,兴业... 7月11日,三大股指早盘小幅拉升,其中上证180指数小幅上涨。截至上午9:50,兴业上证180ETF...
“若实现将系就职以来首次”,鲁... 【环球网报道】据香港《南华早报》报道,美国国务卿鲁比奥当地时间10日表示,他正筹备与中方在马来西亚举...
嘉元科技:7月10日融资净买入... 证券之星消息,7月10日,嘉元科技(688388)融资买入4061.02万元,融资偿还3739.52...
沪指重返3500点,继续上攻动... 时隔三年多,沪指收盘重返3500点。 截至7月10日收盘,上证综指涨0.48%,报3509.68点,...