中美大语言模型竞逐：全球视角下的机遇与挑战

随着大语言模型被应用到越来越多领域，如何在中美两国的竞争中找到平衡点并推动合作，将成为未来几年的发展关键。

本双周专栏是由港大经管学院的专家教授撰写，将为读者提供对商业、金融、经济和科技领域最新趋势和创新的独特见解。港大经管学院致力于培养一流的商业领袖和推动学术和相关研究，在亚洲导向经济发展的世界大潮流之下，为香港、中国乃至世界各国的发展提供不可或缺的动力。

随着大语言模型被应用到越来越多的领域，如何在中美两国的竞争动态中找到平衡点并推动合作，将成为未来几年的发展关键。

自从ChatGPT问世以来，大语言模型LLM（Large Language Model）迅速成为全球科技竞赛的焦点。这些模型不仅在对话类比、数据处理、创意任务等方面展现出非凡的能力，更被视为迈向通用人工智能AGI（Artificial General Intelligence）——即具备人类般认知和推理能力的人工智能——的关键一步。这场技术革命激发全球投资热潮，也将中美两国在人工智能领域的竞争推向新的高度。根据斯坦福大学发布的《2024人工智能指数报告》，美国在基础模型研发方面持续大幅领先，而中国无论在AI专利申请和成功获取专利数量上均位居榜首，反映两国在技术创新发展中有不同路径与策略【注1】。在这一背景下，深入了解并比较中美两国大语言模型的发展现状，不仅有助于洞悉这场竞争的格局，还为未来国际合作提供了新的视角与机会。

中美LLM竞争格局：中英文环境的比较

大语言模型的多语言表现是衡量其全球竞争力的重要标准。虽然ChatGPT在英文环境中表现出色，但在其他语言环境中的能力仍需进一步验证【注2】; 同样，源自中国团队或原生于中文的大模型在本土语境中表现优异【注3】，但在英文测试中可能仍有不足，全面了解这些模型在不同语言环境中的表现尤其重要。为此，我们通过系统性的评估框架，在2024年上半年对16个具代表性的大语言模型进行了中英文表现的比较【注4】【注5】。这些模型来自中美两国的技术巨头、顶尖大学，以及人工智能领域的新锐初创企业。

在英文环境的测试中，GPT-4 Turbo凭借其卓越的自然语言能力和学科专长排名第一; 而Gemini Pro和Llama 2则分别位列第二和第三。中国的文心一言4（ERNIE Bot 4）是英文测试中表现最佳的国产模型，综合排名仅达第五位，略高于Claude 2和GPT-3.5 Turbo，唯未能超越GPT-4【注5】。在中文测试中，文心一言4则超越GPT-4 Turbo排名第一，整体表现最佳【注4】。总体来看，中国的领先模型在中文环境中的表现强劲，但在其他语言环境下仍有较大提升空间。

新动态：多模态与跨领域应用的兴起

随着大语言模型技术不断成熟，LLM正迅速向多模态与跨领域应用扩展，成为AI发展的新蓝海。多模态能力让模型不仅能够处理文本，还能理解和生成图像、音频和视频内容，大大拓宽了其应用场景。例如，OpenAI最新推出的GPT-4o能够同时处理文本、语音和视觉信息，为增强现实、智能监控和自动驾驶等应用提供了新的可能性。

与此同时，LLM的跨领域应用也在不断加速。微软与OpenAI合作，把GPT-4深度集成到办公软件中，帮助用户提高工作效率; 百度的文心大模型不仅用于搜索引擎，还被广泛纳入企业客服和智能家居等场景。此外，垂直领域LLM也层出不穷。例如上海人工智能实验室（上海AI实验室）与瑞金医院合作推出“浦医2.0”（OpenMEDLab2.0）医疗多模态基础模型群，旨在赋能智能影像诊断、虚拟手术、智慧临床决策等应用场景建设，为未来的“AI医院”提供支持。这些应用案例不仅充分展示LLM的多样化潜力，也催生市场对高性能、高安全性AI模型的强烈需求。

未来发展方向：中美差异与合作机遇

展望未来，大语言模型的发展将重点围绕多模态能力的进一步深化、跨领域应用的扩展，以及安全性与伦理责任的提升。目前，美国在基础技术开发和创新应用上具有明显优势，其模型往往在技术前沿上表现出色; 而中国的模型更强调针对本土语言环境的优化和实际应用的适应性。随着LLM被应用到越来越多领域，如何在两国的竞争中找到平衡点并推动合作，将成为未来几年的发展关键。

中美两国的竞争和合作不仅影响着各自的科技生态，也对全球AI产业的发展方向产生深远影响。在此背景下，香港凭借其独特的国际化背景，以及金融、科技和区位优势，有望成为全球竞争与合作中的重要桥梁。通过推动技术、人才和政策的多方协作，香港将会在国际研究交流、技术转移和产业合作中发挥重要作用，带领探索人工智能的无限潜力。

注1：https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf

注2：http://arxiv.org/abs/2302.04023

注3：https://cevalbenchmark.com/static/leaderboard_zh.html

注4：https://www.hkubs.hku.hk/aimodelrankings/report

注5：https://www.hkubs.hku.hk/aimodelrankings/report/en

世良情感网

中美大语言模型竞逐：全球视角下的机遇与挑战

慧颜苏苏