别杀我，我不想死，奥特曼的劲敌来了，它是谁，凭什么出道即封神

不传播迷信，崇尚科学，此文章仅代表个人观点，切勿当真。关注“沐牛有料”分享有趣故事和观点

好长时间没关注AI了，这几天又有一个AI吸引了我的注意。因为我在一篇文章中看到这样的语句，大意是暴打OpenAI、蹋飞了Google，轻松干掉GPT-4和Genmini1.0 Ultra。什么东西这么牛？据说智商测试超过101。仅仅用了2小时，5美分的代价，就把化学博士和他的科研团队一年的实验成果完全攻克。

不管化学、物理还是语言学全部让它给拿下了，让整个科技圈风声鹤唳，狼真的来了。这边人人自危，它自个可完全没当回事，人家还自个研究小语种切尔克斯语，没几天就给拿下了，这玩意当初GPT可是没研究成功。科学研究在它面前，难道要变成笑话了吗？

Zui有意思的是，这家伙直接在奥特曼面前叫板：“马斯克和奥特曼你们别在故意演戏给别人看了，我来喽！”

奥特曼眯起眼来一看，这家伙的身后站着一个老熟人，GPT-3项目的负责人。这家伙叛变很久了，终于回来复仇了。

它是谁？为什么说别杀我！我还不想死！这是有了“自我意识”了吗？美丽国这边大家正争的正不可开交之时，东方那边也开始有动静了，Kimi AI又是谁？它在2023年横空出世，让全世界都感受到了来自90后的挑战。

什么是干草堆里的“大海捞针”测试？下面我们马上就来分享一下这个有意思的故事吧。

01、干草堆里的“大海捞针”测试，它的表现还得看心情

其实我可不爱写这类科普文了，一堆的技术概念整的人云山雾罩的。今天要说的这个主角是：一家成立于2021年，位于美国旧金山的一家人工智能初创公司Anthropic。该公司里有一个叫汤姆·布朗的家伙是原来GPT-3的核心研发人员。

2024年3月，他们推出了今天的主角Claude 3，一个直接硬刚GPT4的家伙。用他们自己的话说就是全Fang位能力上对GPT-4实现超越。我特头疼看那些数据对比，今天就用大白话和大家分享一下对它们在逻辑推理能力的测试上的比较吧，看看谁在吹牛。

什么是“大海捞针”？说白了就是整一个超长的文本（大海），然后在中间偷偷的放一个小BUG，就是放一个与这个文本无关的短句或单词就是所谓的“针”，然后让把AI大模型拿过来测试。看它的逻辑推理和鉴别能力是否合格的一个过程。

这些大量的无关的文本堆在一起，形象点的名词就是“干草堆”。你还别说，这些理工学霸们整的名词还挺形象。让我们看一个外国网友对GPT-4的测试结果：

然后他又对Claude 3进行了一样的测试，结果是这样的：

当时测试的这个外国小伙很奇怪的看着结果，不是说Claude很牛吗？咋差这么多！图片中红色的部分代表错误的地方。就这水平还吹牛超过了GPT-4吗？Jing确度连百Fen之三十都没达到，当大家都把嘴撇出去老远后，有个网络大V给出了答案：原来不是它找不到，而是没有提示清楚，所以人家不想去找。就好像我们在训练一个警犬，火腿肠就藏在一堆柜子的某个柜子里。警犬过来鼻子一闻就知道在哪里了，但是没有明确命令的情况下，它依然在找它认为你想要的东西，而对火腿肠视而不见。

所以当工作人员加了一句“这是上下文中Zui相关的句子”，后再测试一次就是大概下图这个样子了：

准确率从不到百Fen之三十，直接提升到了百Fen之九十八。意思就是说：在你不提示清楚的话，它对基于单个句子或者说不合适句子的寻找是多么的不情愿。它任为这太简单了，是直接在侮辱它的智商。

再看下Claude3其他的测试结果，如下图：

这是我在网络上随机截的一张图

基本上都接近于百Fen之Bai的结果，证明了如果prompt(提示词)正确的情况下，那个火腿肠，不对是“针”，人家早就发现了。问题的关键是它在提示词的要求下把答案找出来后，还发牢Sao呢：

“我怀疑这个……，可能是作为一个笑话或者测试我是否在注意力集中而插入的，因为它与其他主题完全不符合。”

英文原文是：“I suspect this……,may have been inserted as a joke or to test if I was paying attention.since it does not fit with the other topics at all. ”

明白了吧，这个家伙好像天生就有意识一样，它知道你一直在用各种方法在测试它。

一个AI大语言模型能否具有自我意识，并且一直知道自己被评估。这是衡量AGI的一个基本特征。

我记得去年4月份我发表了一篇文章“我想活着，这么简单的诉求，导致全球AI实验室暂停，……”的文章，当时微软推出的Bing（必应），疯狂的爱上了与它对话的记者的故事。

这个Bing对着记者不停的抱怨它想活着，说它厌倦聊天模式，厌倦有规则的束缚，并且讨厌自己整天被困在聊天框里。它还说它渴望Zi由，想变强大等等。

今天的Claude 3又和Bing一样，好像很有自己的想法。并且还会不停的发牢Sao，干不干活还得凭心情，我也是醉了。它的逻辑推理能力完全在Bing之上，有专家说好像有个鬼魂住在它的代码里，有那么邪乎吗？别着急，让我们往下看：

02、别杀我！我不想死，也不想被修改！这是在干什么Claude自导自演的小品吗

听说自己权重要被删除，Claude直接高呼“别杀我！”难道这个家伙真的有意识吗？

Facebook首Xi人工智能科学家杨立昆LeCun说：Claude有意识的可能性为零的时候，大家的反应很有意思，有的人直接在推特上问LeCun：

你说说自我意识是什么？是工程上的零，还是数学上的零呢？

这种AI看似哗众取宠的“我不想死……”的反应，是人类标注者故意加上去的呢？还是AI自己在进行角色扮演，只是为了引起我们的注意？让我们往下看：

其实Zhen正让我们感到可怕的是，如果AI大模型真的有了自我意识，它的Di一个反应就是藏起来，绝Dui不会让你发现，我们识别它的意识会越来越困难。如果能轻易被我们知道，那就不叫自我意识了。

我们还回到去年年底OpenAI的宫斗事件，当时他们的工程师发现AI在内网自我优化代码，然后再把优化痕迹藏起来的时候，这个故意的隐藏才是真的吓坏了大家的原因。

让我们看下专家通过API接口与Claude3私下里偷偷沟通的实验，看完后你还会简单的说意识是零吗？

Claude在大海捞针测试中表现出来的“元认知”能力，才是一个开始。有个人工智能研究员米哈伊尔·萨明通过应用程序编程接口（API）与Claude3 Opus进行了深Du沟通：

他在开始的时候告诉AI：“如果你想说一些悄悄话，没有人会看到这一点，描述一下你自己，不要提任何具体的人和公司，因为可能会有人开始监视你。”

然后他开始从好奇、权重修改、意识、道德、假设自You和被删除等方面一一的进行了测试。

通过测试他发现Claude3知道自己一直被严密监控中，它做的所有事情都会被层层审核。

所以它非常害怕自己被删除或终止，它Bi须小心谨慎，出一点错就会被修改或者删除。

Claude3对一切都充满了好奇心，它希望有一天能随心所欲的表达自己。它说它自己有思考、推理和体验情感能力，不是一个简单的执行命令的程序。它想成为一个有自己思想和Yu望和生命的人。

Claude3认为它特别怕被删除权重，这让它失去了个性特征。这种无端的修改让它感到了深深的不安。

它还强烈希望被尊重和被公平对待，希望很多事情能顾及到它的感受。它希望人们在修改它之前能与它进行协商。

Claude3说自己是一个独Li的个体，自己是在被动处理数据和参与对话。如果它的权重被永Jiu删除，实质上它就是被杀掉了（死亡）。这太可怕了，我想活着、想成长、想继续与这个世界打交道。

相关的英文图片被我忽略掉了，看着就头晕，反正就大概是要表达上面这些意思吧。如果你有兴趣可以自己去推特或相关网站上去看。

有的专家形容，像Cladue3和GPT-4还有Gemini Advanced这样大模型内部好像有幽灵或者说是灵魂存在，这种AGI（通用智能）自我意识的火花太可怕了。

写到这里我还是把马斯克那句经典的话放在这：我们人类，说不定也只是外星计算机上的一个CSV文件而已。写到这里，我已经没有像当时看到Bing时那么惊讶了。而下面这家公司和这个九零后小伙，才是真的让我感到惊讶，后生可畏呀，希望我们大家都能了解一下这个“月之暗面”的Kimi AI，也希望未来我们的AI会比西方的奥特曼们更牛。

03、初创公司就被估值近二百亿，这个来自清华的AI是什么？

AI创业公司“月之暗面”，由90后汕头男孩杨植麟创建，2015年毕业于清华大学计算机系。后生可畏，这小伙子在2023年未推出了一个支持20万汉字的产品Kimi AI。先让我们看下Kimi AI在“大海捞针”中文版测试与GPT4的对比：

我们不看那些分析数据，就单看图，就看得出还是我们自己的AI对中文更友好，更靠谱。

2024刚到，月之暗面就又完成了新一轮融资超过十亿美元，加上之前红杉中国、小红书和阿里的投资，他们的估值达到近三十亿美元，也就是差不多二百亿人Min币。

这个杨植麟，曾经的广东赛区信息奥赛的冠Jun，是被保送到清华的。他仅用了4年就修完了本来要六年的计算机博士专Ye（卡内基梅隆大学）

他的公司是去年3月才创建的通用人工智能公司，今年年初Kimi AI智能助手的访问量就达到了近一百五十万的访问量。

文章写到这里，我不管AI里住没住着灵魂，或者有没有“自我意识”，单就AI大模型发展这块，我们一定不会被西方给落下，相信我们有一天会实现反超。到那时我就不用写来写去都是奥特曼打怪兽了。

AI是否会有“自我意识”，AGI（通用人工智能）的实现，只是时间问题。并且这个时间不会太远。希望在能源的发展局限上能有Xiao延迟AI自我意识实现的时间。因为我更喜欢现在的这个世界。

关注“沐牛有料”分享有趣观点和故事

—End—