金融界2月13日消息,有投资者在互动平台向飞利信提问:公开数据显示公司拥有丽水智算中心一期和二期,都已经在使用中了。且公司自主研发的智能体和大模型也已经运行验证,请问公司的大模型和deepseek大模型的区别,公司的大模型底层也是基于mla技术进行提升效率和运行速度。deepseek开源系统的火爆,相信公司也在研究如何更好的结合自有技术。而公司自有的mla技术在deepseek手里发扬光大,却在自己手里明珠蒙尘,公司有总结反思吗?
公司回答表示:DeepSeek属于基础通用大模型。我们的大模型产品是在第三方基础大模型的通用理解能力之上,面向具体业务领域,通过监督微调、强化学习等偏好优化与知识对齐技术,实现的面向垂直领域的大模型应用。公司针对低算力情况下的推理加速技术有充足的技术储备,并掌握了类似MLA的基于缓存压缩的计算加速技术。公司会加大对公司自有人工智能产品在研发与市场上的投入,积极探索创新技术在实际业务场景中的最佳落地实践与商业价值闭环路径。
本文源自:金融界