DeepSeek究竟是怎么回答你的提问的?答案很简单,大量检索全网相关文章,甄选其中优质的文章内容进行推理和分析比对,再经过自然语言处理生成流畅通顺的回答。这其中,检索优质的文章是最为关键的,所谓巧妇难为无米之炊,没有优质的文章输入,DeepSeek推理能力再强也无济于事。
知酷文旅作为文旅财经领域优质的内容生产者,最近我们发现很多文章被DeepSeek(本文指腾讯元宝DeepSeek满血版)用于生成回答,甚至一些问题DeepSeek的答案中,知酷文旅是唯一资源来源。
举例来说,向DeepSeek提问:2024年全国主要国家分别接待多少中国游客?
DeepSeek一共检索了全网40多篇文章,甄选了其中4篇作为资源来源,这4篇中有2篇是知酷文旅撰写的原创文章:(往期回顾)(往期回顾)。该回答中大量的内容和数据直接来源于知酷文旅。
DeepSeek和知酷文旅的文章对比
以至于DeepSeek该回答中的数据来源声明,都和知酷文旅的一模一样。
DeepSeek和知酷文旅的文章对比
也许有读者会问,国际旅游的数据都是各国官方披露的,你也没有版权,你用,DeepSeek也用,这不是很正常吗?你就是在碰瓷DeepSeek。
实际上,简中互联网上由于大量做号机构和营销号、矩阵号的存在,导致信息污染极其严重,大量营销号、矩阵号随口编造数据的现象十分普遍,完全不对结果的真实性负责,且他们往往占据了搜索引擎的排名前列,简中互联网上许多数据是错误的。
知酷文旅在搜寻各国旅游数据时,不是简单的搜索引擎搜一搜,而是以各国旅游局、统计局为第一来源。翻到各国旅游局的官网上,看着各国语言五花八门、数据格式众多,详细查询其统计信息说明,搞清楚统计口径和统计周期。收集这些数据并确保真实性,十分费力,许多数字官方并不提供,而是知酷文旅拿着计算器一个个敲着算出来的,比如同比增速、中国大陆游客占比、大陆加港澳台游客占比等。
所以该回答中的数据,知酷文旅不是简单搜索一下官方发布信息,而是用了很多时间精力去整理出来的。而且,知酷文旅不仅提供了数据,还对数据的深度分析,例如在提到越南接待中国游客时,我们特别强调了中越边境一日游,会导致数据含水分。这一分析,也被DeepSeek原样收录。
也许正是因为知酷文旅的数据准确、分析靠谱,才在营销号、矩阵号海量的信息垃圾中,被DeepSeek选中,4篇参考文章中2篇出自知酷文旅。
类似的例子还有,文旅企业商票暴雷的回答。问DeepSeek:最近有哪些文旅企业商业票据违约。DeepSeek一共采用了5条有效信息,其中有2条是知酷文旅自己发布的文章(往期回顾),其他3条是知酷文旅被迈点网洗稿而产生的“二次创作”,洗稿文章又被更多营销号再次洗稿而产生的文章。可以说,这个问题的回答中,实际上的信息来源只有知酷文旅一家。
DeepSeek回答里提到的80家持续预期的文旅企业名单,就是来自知酷文旅的统计:
知酷文旅制作的名单
该表格被迈点网原封不动照抄,改了一个标题,《一大批文旅集团还不上钱了》,从而引爆了文旅圈,进而被许多营销号接连转载。
也许有读者要说了,逾期名单是官方发布的,你能用,迈点也能用,凭什么说迈点洗稿你呢?你这就是在碰瓷迈点网。
实际上,名单是官方发布的不假,但官方发布的是两千多家逾期企业的大名单,没有细分到各个行业。知酷文旅从这两千多家企业中,一家一家的人工核查,看哪些是文旅企业,最终挑选出来了80家。如果迈点也是自己核查的,核查的80家和知酷文旅一模一样,那这只能用奇迹来形容。
从两千多家企业名单中,挑出80家文旅企业,这是个费时费力的工作,迈点网不做,DeepSeek也不做,都Copy知酷文旅的劳动成果。而且说实话,迈点网改的这个标题《一大批文旅集团还不上钱了》,知酷文旅完全不能认同。发行商业票据的文旅企业有几千家,持续逾期的只有80家,比例是极低的,完全谈不上“大一批”。只能说,迈点网这个标题虽然远离事实真相,但离流量很近,事实上也确实如此,该文被各路营销号疯狂转载,进而被DeepSeek收录。
除了数据类的,知酷文旅还有许多分析类的、采访类的文章,也被DeepSeek“深度使用”。例如问DeepSeek,寺庙是否可以开展住宿业务?排名第一的信息来源,同样是知酷文旅(往期回顾)。
回答的核心内容,都是提炼自知酷文旅的文章,如非盈利性、香客留宿制度、不得大张旗鼓揽客,以及一些寺庙的住宿价格等。其中许多信息是知酷文旅和一些知情人士访谈中得到的,受访者是基于对知酷文旅的认可和信任,才愿意接受访谈。这些信息被DeepSeek免费使用。
还有乡村文旅面临的经营难题,这类话题相关的文章汗牛充栋,各路专家、媒体、学院、营销号围绕该话题发布了数以千计的文章,但DeepSeek深度参考了知酷文旅的文章。并且该回答是知酷文旅撰写的《文旅振兴不了乡村(上篇)》发布的第二天,就已被DeepSeek监测并采纳,可谓“忠实读者”。
类似的案例还有很多,不再一一列举。
知酷文旅一方面对于DeepSeek这样国产顶尖大模型的发布,是十分兴奋的,其代表了中国科技力量的进步,宣告西方对中国的科技战的无效。另一方面,看到Deepseek无偿的、系统性的、不打招呼的引用知酷文旅的劳动成果,心里颇有点不是滋味。
事实上,知酷文旅的文章经常被洗稿,但都属于人工洗稿,是偶发性的,如上述的迈点网。这种行为,知酷文旅早已习惯,也无所谓了。但DeepSeek不一样,它的“洗稿”是全面的、系统性的、高频的。
理论上,知酷文旅写的每一篇文章,就会纳入DeepSeek的体系内,只要有人向它提问知酷文旅专业领域的问题,它就会参考知酷文旅的文章。在这个过程中,知酷文旅没有任何利益,在回答的结尾也不会将知酷文旅列为参考文献。甚至,知酷文旅的内容被Deepseek整合、“洗稿”了多少次,我们完全不知情,因为Deepseek的问答是一对一的。
在这种模式下,广大的内容生产者,包括媒体、自媒体、作家、专家、学院机构等都是DeepSeek免费的“打工人”,无偿的为这个大模型奉献自己的劳动成果。
这个体系是不公平的,优质内容生产者的劳动成果,得不到尊重和保护,那么优质的内容生产者就会逐渐消失。长此以往,我们的信息环境就会被大量营销内容、情绪化输出、带节奏观点所淹没。能活下来的内容生产者就是大量营销号、矩阵号,他们使用AI进行极低成本的内容产出。
也许,不久的将来,Deepseek引用整合的信息,全都是自己产出。在逻辑上,这叫“自我循环论证”。
Deepseek是开源的,面对消费者免费使用,但面对企业端是收费的。知酷文旅的文章也是“开源”的,面对读者免费提供。Deepseek既然要向企业用户收费,怎么能自己做为企业用户时,无偿的、长期的、高频的使用知酷文旅的“开源”内容?这不符合开源协议,开源也有开源的规矩。
Deepseek是国产大模型之光,知酷文旅发布本文并非是批评指责,仅作为对新生事物产生的不利影响进行讨论,希望Deepseek能在后续的迭代优化中不断改进,减少对社会的负面影响,更多发挥自身的创造性。