《大辞海》与大模型深度融合,推出智能审校解决方案
“辞文”问世,10分钟审校40万字
以《大辞海》为“地基”,插上人工智能大模型的“翅膀”……昨天,上海辞书出版社与百度、鲸汤(上海)智能科技有限公司在沪发布最新产品“辞文智能知识审校系统”(以下简称“辞文”)。历时两年研发的该产品深度整合我国标志性大型综合性辞典《大辞海》中30多万个词条的权威知识体系与文心大模型理解、生成、逻辑、记忆四大核心能力,成为国内首个融合权威工具书资源的智能审校解决方案。
近几年,文本审校工具如雨后春笋般不断涌现,从早期的黑马校对、方正智能审校,到i校对、凤凰智能校对系统、蜜度校对通、果麦AI校对王等产品,各有所长。融合权威辞书资源和大模型能力的“辞文”瞄准了传统文本审校在知识性、逻辑性方面的痛点,实现四大技术突破:一是精准的知识溯源能力,当发现错误时,系统不仅能指出问题所在,更能通过Agent技术精准定位到《大辞海》中的相关条目,展示完整的知识链条,让用户不仅知道“错在哪里”,更明白“正确的应该是什么”;二是强大的多轮推理能力,可深入验证文本多维度合理性,找出隐藏的逻辑谬误,比如当审核一篇关于历史人物的文章时,系统不是简单地核对年代,而是会通过多重推理,验证人物关系、历史背景、事件顺序等多个维度的合理性;三是动态的知识更新机制,当《大辞海》数据库有更新时,系统能自动完成知识的同步;四是智能的交互式审校流程,通过有效控制大模型的发散、幻觉问题,提供个性化的审校建议,这种人机协作的方式既保留人工审校的专业判断,又发挥了AI的效率优势。
通过高算力支持,“辞文”目前可在10分钟之内完成40万字文本量的审校。样本实测数据显示,采用该系统后,审校工作效率成倍提升,错误识别准确率可达80%。
“随着知识专业化分工的日益精细,单个审校人员难以完全掌握跨学科知识,市场迫切需要一套智能、高效、准确的知识审校系统。这不仅是新闻出版机构、内容发布平台的把关利器,也将是整个内容创作行业的前置工具。”上海世纪出版集团副总裁、上海辞书出版社社长秦志华表示,“辞文”突破以往文本审校工具的局限,实现从“文字纠错”到“知识审校”的能力跨越,其价值更在于守护知识传播的准确性与严肃性。据悉,目前该产品已应用于人文社科、科学技术等出版领域的文本审校,未来还将拓展至新闻传媒、教育科研等场景,致力于成为内容生产领域的“数字质检员”。
上海辞书出版社针对一份50多万字的关于上海历史主题的付型稿件,采用“辞文”进行深度检测,系统共标记471处潜在错误,经专业编辑团队逐条复核,最终确认采纳87处知识性差错(含历史事件误记、人物关系错位、地理沿革错误等),错误类型覆盖上海开埠史、租界制度、地方文献等专业领域。横向对比测试数据显示,“辞文”系统检出471处,确认采纳87处;而此前一审校产品检出262处,确认采纳0处。
有“语林啄木鸟”之称的上海《咬文嚼字》也试用“辞文”测试了11条材料,7条提示没有审校到错误点,4条提出了修订点。其中对一句元好问诗句的纠错令上海咬文嚼字文化传播有限公司总经理王敏惊艳,对唐代诗人李端的字的纠正也很正确。他感慨,在大模型助力下,通过人机协同,产品有很大潜力。