8月28日,以“数据赋能 生态共建”为主题的2024数博会“数据要素赋能生态”交流活动在贵阳举办。拓尔思应邀参加,副总裁林松涛发表“数据智能的知识革命——大模型的行业实践”主题演讲。同时,拓尔思参与编写的《数据要素变革下的大数据产业生态发展研究》正式发布,为科技日报社打造的大数据科技资讯服务平台入选《2024数据要素创新应用案例集》。
数博会是全球首个以大数据为主题的国家级博览会,已成为展示中国大数据发展成就、汇聚全球大数据资源的国际性盛会、世界级平台。作为2024数博会的重要组成部分,本次活动汇聚了政产学研用各方力量,全面围绕数据要素价值释放、数字技术落地应用、数据赋能生态构建等议题展开深入研讨,旨在构建高水平、高规格的使能平台、创新平台,为推动有为政府和有效市场更好结合,链接各方共同打造数据要素赋能良好生态贡献力量。
数据智能的知识革命:拓天大模型的行业实践
林松涛在演讲中探讨了大模型应用落地的趋势,指出从早期各个模态模型独立发展到多模态模型发展的过程中,大模型的技术迭代加快,多模融合能力持续提升。然而,大模型在实际应用中仍存在算力成本高昂、大模型“黑盒特性”挑战、应用没有深入到业务流、落地难以真正实现业务价值释放等常见的“泥潭”。对此拓尔思展开了多方面的探索与创新。
数据决定了大模型的智力边界,拓尔思以数据智能为核心,推出了拓天大模型一体化平台,覆盖从训练数据集、AI训练平台、AI能力平台到AI服务平台的完整流程,最大化利用大模型能力,为用户提供专业化定制化服务。
依托自有的互联网数据中心与数据中台系统,拓尔思实现了高质量数据采集与专业数据治理,目前数据中心数据总量已突破3000亿,涵盖文本、图片、音频、视频及GIS等多种模态,构建了从采集、汇聚、处理到分析、应用、运维及安全保障的全方位数据能力体系,为大模型通用能力提质、落地持续精益提供数据支撑。
通过创新性地融合海贝向量数据库、企业级RAG、知识图谱等技术手段,不仅有效缓解了大模型幻觉问题,还显著提升了大模型的准确性、鲁棒性,减少偏见与歧视,增强价值观对齐。同时,拓尔思研发了自主演化的任务链“拓天链”,实现知识和数据混合驱动,打通AI落地最后一公里。
林松涛还分享了人民日报AIGC智能助理、平安银行“审计大脑”稽核专业大模型、海尔官网“智能助手”专业大模型等拓天大模型在不同行业垂直领域落地的成功案例,生动展现了拓尔思在以高质量数据和专业化能力推动行业数智化转型的成就。
数据要素创新应用案例:拓尔思×科技日报社
会上,由赛迪传媒《软件和集成电路》杂志社联合拓尔思等多家单位编著的《数据要素变革下的大数据产业生态发展研究》、《2024数据要素创新应用案例集》正式发布。拓尔思“科技日报激发数据要素价值,打造大数据科技资讯服务平台”收录至案例集中,不仅验证了拓尔思在媒体行业技术创新的实力,也为数据要素应用新模式提供了思路与启示。
针对科技日报社基础数据资源扩展、传播力分析及其他数据分析统计准确度提高、新媒体新闻发布集中审核监管等应用需求,拓尔思制定“三步走”的解决方案:步骤一,打造大数据支撑服务平台,实现数据的梳理、加工和整合工作。步骤二,构建服务平台,实现内外服务。步骤三,打造精准专题生成服务平台和智能数据平台,深化对外服务。
发展至今,科技日报社的数据底座共接入近8000个信源,资讯总量达到2.3亿条,为报社新闻资讯留存、新闻生产支撑和数据资讯服务等方面提供了有力支撑。大数据科技资讯服务平台服务应用目前已覆盖了生物、医药等行业领域,并且能够针对特定高端用户实现精准数据推送。目前,移动终端覆盖了全国31个省科技厅局、高新区及有关科研院所等单位机构。
未来,拓尔思将依托数据智能领域的深厚技术积累与持续创新能力,推动数据要素的深度应用与广泛赋能。