今年春节这几天,我觉得最有意思的事不是看晚会这些,而是和deepseek聊天,同时也看互联网上对deepseek的各种反应、评论。
毫无意外的是,对DS的各种评价都有,有赞美的,有反对的,有呐喊的,还有抄袭了解放军关于
人工智能
发展的白皮书,冒充自己关于AI对战争样式思考的,有用deepseek的创作能力编写关于deepseek的心灵鸡汤故事骗流量的,训练deepseek用各种口味吵架骂人的,五花八门。
我自己的使用感受是,deepseek和以前用过的各种生成式AI相比,逻辑性特别好,而且提交完整答案之前,ds会把整个思考逻辑完整列出来。再有一点,DS有人味,不是那种机器人味,我们不需要拿出一大堆详细描述的问题,附加一大堆参数要求,就和正常人聊天一样,它就能很容易并且准确判断我们需要什么答案,很自然很轻松。而且让它写中国古体诗词,短篇小说,作品水平也很有韵味。
最重要的感受是,大家如果选择R1的深度思考,不选择联网搜索,它就能从自己的MoE,也就是混合专家模型里动态提取很专业的内容,而很多以前的国产AI基本是只能做到网上抓取信息汇总。而互联网的消息混杂,虚假内容占比极高,按照2年前我们在腾讯开会的时候,腾讯反谣言部门的说法,涉及军事政治的网络信息,谣言比例高达90%以上,所以很多低水平生成式AI被严重污染,活生生成了人工智障,能把网民弄傻的爽文,毁掉一个AI更容易。这一点,DS自己的专家模型就很不错,我测试过几个军事技术和军事历史问题,DS的回答都很让人满意。
从这些使用感受就看出来,DS底层的东西变了,和过去我们见过的那些大厂套壳产品,抓取生成式人工智障完全不是一个层次。所谓套壳,就是把国外的生成式AI拿过来,换个界面,换个包装,比如几年前参加某平台的创作者大会,组织方让我们试试他们的AI,用AI画一幅画,我就让AI画一个中国古城,结果画出来的居然是当年欧洲传教士画中国建筑那种味,可见这个AI的底层根本不是中国自己的,所以前几年我们总看到国产的生成式AI总在追总在模仿。2023年年底,给北京理工大学的学生出论文题,其中包含国产生成式AI的发展和应用,有一个学生的论文说的非常好,中国一定要有自己的核心技术,自己的构架,套壳绝无出路。DS这次拿出了自己的构架,能够高效低成本解决问题,这种成绩也是结结实实打了一些大厂的脸。
上面说的还是个人使用app的感受,DS的更大意义在于,它是可以各个行业带来生产力的,举个例子我让文小言这个AI自己阐述了一下和DS的功能区别,文小言对自己的描述是文章创作、图片生成,语言聊天等等,完全只是为了媒体创作而生,而根据DS自己提供的应用案例,他们在浙江一个三甲医院,用16.8亿参数的病灶识别专家模型,对CT影像的分析速度达到1.2秒/例,准确率97.3%。完全不一样的格局。
而且,要在各个行业运用起来,成本也是问题,以前的AI竞争,动不动就要比拼上千亿参数,要比赛谁有大量算力,哪个医院玩的起,哪个小企业玩得起?
但是现在这么多人在自家电脑上用老电脑都能部署DS了,全社会的应用门槛降低的,这意味着什么?美国用芯片封锁这种方法想遏制中国AI,这条路走不通了。不仅走不通,现在美国欧洲这么多国家,发现根本反不动DS,就开始纷纷表示接纳,比如微软和英伟达都要和DS深度合作,这又意味着什么?意味着以后中国能主导AI市场的方向了,甚至我们未来可以主导全球的产业发展、生活方式、价值观和意识形态领域的革命。这就不难理解为什么DS这些天遭受了那么频繁的来自美国的网络攻击,不过我认为那些网络攻击,只不过是无能狂怒的表现。
其实,10年前,我们要做一个行业管理软件,当时和北大一个搞人工智能的团队聊过人工智能发展,有个教授的话很有意思,他说人工智能发展不能只靠算法算力,还要从智力的本质进行研究。后来,军委科技委那套十三五重点出版物颠覆性军事技术丛书中的人工智能分册,在审稿的时候,我也聊过一个话题,人的智能是哪来的,除了后天的学习,有些智能是先天具备的,也不是靠算法算力堆出来的,其实也是构架问题。当然这些问题现在并没有答案,人类距离彻底打造强人工智能,复制真正的人类思维还很远。
但是今年春节我们看到的,DS在构架上的创新,可能就是解决这些问题的,一系列惊喜的开端。
最后建议,大家安装一个deepseek,当学习和工作的工具和助手,别光只是图个新鲜,只是玩。因为这类AI大量应用,也会让人和人之间的能力,更迅速地拉开。