在7月4日至7月6日举行的2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)上,全球技术领袖、行业专家和投资者齐聚一堂,共同探讨和展示最新的人工智能技术及其商业化应用。
满场的AI大模型和机器人在教育、医疗、金融、零售、汽车、工业等行业的落地应用,不仅显示出AI技术的突飞猛进,还在以汹涌澎湃的创新动能,叩响着各个行业的变革之门。
突破与创新:商业化落地的实践
WAIC 2024不仅是AI领域技术创新的展示窗口,更是商业化探索的前沿阵地。如果说,在WAIC 2023期间,业界对大模型的认同还有所犹豫,那么今年所有人都对大模型即将带来的改变力量深信不疑。在本次大会上,AI大模型技术以其强大的数据处理能力和应用潜力,成为了业界关注的焦点。加速大模型的应用落地,已经成为当下行业的共同追求,而对于大模型如何更好应用,各家也逐渐有了各自的心法。在技术方面,AI大模型的发展呈现出多个特征。首先,AI大模型正在从单一的语言处理向多模态能力发展,整合图像、声音、文本等多种数据类型,提供更为丰富的应用场景。比如,汉王科技在WAIC 2024上展示的汉王天地大模型,其设计之初就采用多模态路线,具备文本、语音、图像、视频和跨模态交互能力,以及深度专业化、知识实时化和生成精准化等特点和优势,并于今年3月通过国家大模型所有备案。该大模型已成功应用于国家级图书馆、国有大型银行、运营商、能源等行业龙头企业,还赋能汉王AI电纸本、柯氏音血压计、扫描王App等智能终端,提升用户体验“智”感。
阿里云的“通义for everyone”则集成通义大模型全栈能力,以通义千问最新基础模型为基座,整合通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力,最终形成一个All in one的全能AI助手。其次,AI大模型的参数规模不断扩大,实现了从千亿参数到万亿参数的跨越,这不仅提升了模型的学习能力,也为解决更复杂的任务提供了可能。在WAIC 2024上,阶跃星辰宣布对Step系列通用大模型家族进行全面升级。自今年三月正式公布以来,Step系列通用大模型在短短100天左右实现了从千亿参数到万亿参数,从语言模型到多模态模型,从理解到生成的全面进步。凭借Step系列的创新,阶跃星辰斩获了“WAIC 2024 SAIL”之星的称号。再者,AI大模型在系统层面进行了优化,例如采用MoE(Mixture of Experts)混合专家模型架构,提升了模型的训练效率和推理能力。阶跃星辰最新发布的Step-2万亿参数语言大模型正式版,采用了创新的MoE 混合专家模型架构,同时基于阶跃星辰行业领先的系统能力,大幅提升了训练效率,在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面逼近GPT-4。此外,针对特定行业,如医疗、金融、教育等,AI大模型进行了定制化开发,以满足行业内特定的需求和挑战。百川智能展示了其通用医疗增强大模型和AI健康顾问应用。该AI健康顾问不仅在USMLE(美国医考)的评测中超越了GPT-4,还能像全科医生一样,通过多维度提问了解用户症状,给出诊断结果和用药建议。这一应用提升了医疗效率和质量,展示了AI在医疗领域的广阔前景。当下,企业面临的挑战与以往不同,需要精准找到每个行业、每个企业对“高质量”的定义。第四范式持续打磨各行各业的行业大模型底座,提供为企业解决核心业务痛点的场景大模型集合。经过十年发展,第四范式在金融、能源电力、交通运输、运营商、制造、医疗、零售等行业已累计服务1058个客户。最后,AI大模型开始与机器人技术、自动驾驶、艺术创作等领域的结合,推动了跨学科的融合和创新。“AIGC第一股”出门问问携AIGC艺术展、通用大模型“序列猴子”及其AIGC产品矩阵亮相。其中,AI短视频创作平台“元创岛”依托出门问问自研大模型“序列猴子”,可为创作者提供AI一键成片原创短视频,除了可以生成儿童绘本,也可以快速生成小说推文、短剧引流广告、书单及歌单等短视频变现内容。在商业化探索和落地方面,除了上述医疗健康、金融、内容创作与分发典型场景外,AI大模型的应用还涉及企业服务、教育、能源、自动驾驶等多个领域。在企业服务层面,作为国内大模型应用商业化跑在前列的企业之一,金山办公在WAIC 2024期间发布了WPS AI 2.0,包含WPS AI办公助手、WPS AI政务版等应用,并推出政务自研模型—金山政务办公模型1.0,擅长公文写作,可针对通知、请示、发言稿、通报、方案等5类公文进行撰写。在教育行业,蚂蚁云科技集团的以正教育大模型全面升级,涵盖教师端、学生端、家长端和管理端,并推出围绕以正教育大模型为核心驱动的1+5+∞——AI智慧教育整体解决方案,不断推动教育场景的创新和拓展。“教育科技风向标”猿力科技于今年5月通过大模型备案后,首次通过WAIC 2024展示了自研大模型支撑的教育产品“全家桶”,包括飞象星球、猿编程、小猿学练机、海豚AI学等国内教育服务产品,及旗下两款AI教育出海产品CheckMath、LeapMath。在能源领域,AI在减少碳排放、能源需求优化以及提高运营效率三大方面发挥着重要作用。施耐德电气副总裁、数字化创新业务中国区负责人,施耐德电气(中国)软件研发中心负责人张磊表示,人工智能已经成为施耐德电气业务的重要增长点。无论是在中国乃至全球广泛铺就的AI研发布局,还是与各行业生态合作伙伴共同展开的融合创新,都让施耐德电气得以尽早地将AI技术与广泛的应用场景深度融合起来,率先化身为以AI技术推动能源转型的“践行者”和“赋能者”。一个鲜活的实例是,施耐德电气无锡工厂通过数字化转型,成为世界级的“端到端灯塔工厂”,在确保系统100%安全可靠运行的基础下,实现了100%绿电消费,工厂运营阶段平均度电成本降低7%。在自动驾驶方面,特斯拉、蔚来、极越等也展示了利用AI大模型进行环境感知、决策制定和车辆控制,以实现安全、高效的自动驾驶体验。值得关注的是,易控智驾再次实现了矿山无人驾驶商业化的里程碑式突破。本次发布的著山2.0方案相比著山1.0,更加深度地应用了最新一代的AI技术,采用BEV+Transformer+OCC多模态感知预测技术和应用大模型实现了海量数据的高效自动化标注,实现了更智能、更灵活、更精准、更全面、更高效、更易用的六大特性,具备了超大规模露天矿有人+无人矿卡的混编调度、有人+无人矿卡混行流畅运行的能力,从而覆盖了煤矿、石灰石矿、金属矿等多种露天矿,以及雨、雾、雪、煤灰、粉尘等复杂环境下流畅高效作业能力。具身智能体:AI与物理世界的融合
几年前,机器人还多以底盘式和圆球手的机器人为主,而在本届WAIC 2024大会上,具身智能体技术成为了一大亮点。它不仅展示了AI如何与物理实体结合,开辟了新的商业应用领域,还意味着在当下的AI领域,具身智能体技术正逐渐从理论走向现实。目前,几乎所有大模型厂商都在智能体领域做进一步技术尝试,这也是AI大模型走向商业落地的另一个侧面。在服务行业中,具身智能体拥有广泛的应用潜力,如酒店、餐饮、零售等领域的导引、咨询和服务工作。在医疗健康领域,具身智能体可以辅助进行诊断、监护和治疗,甚至在手术中提供精准操作。在工业自动化方面,具身智能体可以执行精确的组装、检测和包装任务,提高生产效率和质量。同时,具身智能体能在危险或人类难以到达的特殊环境中工作,如深海探测、太空探索、灾难救援等。具身智能体还可以作为家庭伴侣,提供陪伴、教育和娱乐服务,尤其适合儿童和老年人。具身智能体的发展还促进了新商业模式的出现,如基于订阅的服务模式、按需使用的租赁模式等。此外,随着3D打印和模块化设计技术的发展,具身智能体可以根据客户需求进行个性化定制。目前,具身智能体技术体现在多个方面。一是,多模态交互技术创造出情感交互的能力。具身智能体不仅需要能够理解自然语言,还要能够通过视觉、听觉和触觉等多种感官与环境进行交互,识别人类情绪并做出相应的交互反应。例如,云深处科技基于大模型的机器人智能决策系统“机器人云脑”为X30机器狗赋能“大脑”,搭载该系统的X30机器狗不仅可以开口说话,理解人类自然语言,还学会了识别理解抽象图像,欣赏梵高画作,感知并抚慰人类情绪。二是,自主学习和决策能力。具身智能体需要能够基于环境的反馈进行自主学习和决策,利用机器学习和深度学习算法,不断优化自己的行为模式,以适应复杂多变的环境。WAIC 2024大会现场不仅有能做深蹲的人形机器人,会唱歌的数字人,还有会炒菜和倒咖啡的机器人,甚至自动码货的物流机器人,这些人形机器人最多28个活动关节,复杂且智能。三是,高级机器人平台。这些平台能够执行更加精细和复杂的任务,如特斯拉的Optimus人形机器人在工业应用中具有非常大的潜力,尤其是在精细操作和协作任务上。四是,集成AI模型。具身智能体背后通常集成了强大的AI模型,如专注于认知智能的岩芯数智RockAI,在现场展示了一款部署了公司Yan1.2多模态大模型的智能机器人“小智”。这款机器人相对“迷你”,能实时识别环境、准确理解用户的模糊指令和意图,像人一样进行思考,完成各类复杂任务。当现场观众给出“请让开,我要放东西”的模糊指令时,小智可以据此识别人的意图和行动方向,做出相应的避让动作。更令人震撼的是,WAIC2024的镇馆之宝——“十八金刚 人形机器人先锋阵列”,网罗了中电科、复旦大学、达闼、傅利叶、钛虎、星动纪元、卓益得、开普勒、宇树等18个国内领先的机器人产品。官方数据显示,本届大会合计展出的人形机器人超过25款。国产算力:市场供需创造新机遇
随着大模型行业发展进入规模化产业落地阶段,应用场景的百花齐放,带来了对大模型训练日益迫切的需求。巨大的市场前景,使得基础模型和算力芯片的行业玩家迅速攀升。在WAIC 2024上,中兴通讯全面呈现了从算力、网络、能力、智力到应用的全栈全场景智算解决方案,分享在连接、算力、产业数字化、终端等方面的创新方案与实践成果。在智网底座层面,中兴通讯提供算、存、网、数据中心等全系列产品,构建多样化、高算效的智算资源池,开放解耦,全面适配业界主流GPU,打造多元算力超市,实现资源按需配置。在智算平台层面,提供大模型工程化全栈工具和引擎,简化大模型训练、精调和部署过程,加速AI应用创新;全面适配主流大模型,模型拎包入驻,性能成本最优,无感迁移,高效推理实现千亿模型单卡部署。在大模型应用层面,中兴通讯自研星云大模型,先后在研发提效、通信网络运维、城市治理、工业园区等多个方向推出大模型应用,孕育新质生产力。从WAIC 2024来看,国产算力的性能和易用性已实现大幅提升,正逐渐获得大模型和人工智能应用企业的青睐。超云总裁房玉震表示,随着技术的不断进步,通用算力正加速向智能算力转型,IDC数据中心也正向AIDC智算中心升级,国产算力更是实现了显著增长,这不仅提升了国内算力自给自足的能力,也为整个行业的技术进步注入了强大动力。为了解决能力跨度大、改造难度大、升级风险高、部署挑战大、运维投入大等AIDC建设面临的挑战,超云为客户提供AI全栈智算中心方案,围绕“投-建-运”全生命周期管理,满足客户差异化的建设需求。并行科技最初以超算云商业模式为起点,如今已经发展成为涵盖超算和智算的综合服务商。超算和智算的业务模式与服务具有明显的行业属性,因此并行科技针对不同行业属性,提供定制化的计算服务和产品,针对于每一个行业业务都有相应的配套产品和服务。作为全球领先的IT基础设施供应商,浪潮信息展示了支持多元算力和多模算法的新一代液冷智算中心,以及全系领先的AI服务器、源2.0大模型、企业大模型开发平台EPAI、超级AI以太网交换机X400、适应苛刻环境的边缘AI服务器等全栈智算产品和方案,以及AI for Science、AI for Art等应用。其中,浪潮信息面向“多元算力”和“多模算法”的新一代模块化液冷智算中心,遵循“以系统为核心”的设计理念,从算效、能效、调度管理、交付等方面,实现了整体性能的优化。实现10+业界主流大模型的接入适配,可助力企业轻松跨越AI应用开发与部署门槛,加速智能应用创新。新锐AI智算交易平台——天罡智算交易平台携手合作伙伴亮相,并展示了智算技术在人工智能、物联网、生物科技等领域的创新应用。比如,针对智能算力行业普遍存在的算力资源利用率低下及地理分布不均等核心问题,天罡智算正式推出了全新的算力模式产品——天罡智算交易平台。作为一个全球性的GPU算力交易平台,天罡智算交易平台为企业和团队提供高性能的人工智能算力采买服务,做到即联、即取、即用。由于人工智能、云计算、物联网等技术的发展,当今社会正面临着数据量的指数级增长,算力网络的发展需要高速率、高带宽、高能效的互连技术作为支撑。光电混合技术路线可为算力提升提供全新解决方案,曦智科技正是这一领域的先行者。其从光子矩阵计算(oMAC)、片上光网络(oNOC)和片间光网络(oNET)三大核心技术出发,打造出聚焦于算力横向扩展的光子网络产品线和单节点之内实现算力纵向提升的光子计算产品线,为大数据、云计算、金融、自动驾驶、生物医药、材料研究等领域客户提供更具创造性的高效算力支撑。在算力芯片领域,无问芯穹和摩尔线程两家国产芯片厂商实现了集群能力突破,为我国自主可控的AI大模型攻坚建立了关键基础设施。在7月4日召开的WAIC 2024 AI基础设施论坛上,无问芯穹联合创始人兼CEO夏立雪发布了全球首个千卡规模异构芯片混训平台,千卡异构混合训练集群算力利用率最高达到了97.6%,同时无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性。摩尔线程宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。其以全功能GPU为底座,打造国内领先的、能够承载万卡规模、具备万P级浮点运算能力的国产通用加速计算平台,专为万亿参数级别的复杂大模型训练而设计。WAIC 2024不仅是展示AI技术成就的平台,更是中国企业展现创新实力的舞台。大模型和具身智能体作为AI领域的重要方向,不仅将推动技术进步,更将为社会发展带来深远影响。