IT之家1月22日消息,字节跳动旗下豆包大模型1.5Pro今日正式发布,全新Doubao-1.5-pro模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于GPT-4o、Claude3.5Sonnet等模型。
目前,Doubao-1.5-pro已在豆包App灰度上线,同时开发者也可在火山引擎直接调用API。
据字节跳动官方介绍,豆包大模型1.5Pro使用较小的激活参数进行预训练,采用大规模稀疏MoE架构,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率。
新版豆包视觉理解模型Doubao-1.5-vision-pro、豆包实时语音模型Doubao-1.5-realtime-voice-pro一同发布。
相比上一版本,Doubao-1.5-vision-pro在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。
豆包大模型1.5Pro本次推出了豆包・实时语音模型,并在豆包App全量开放(豆包App升级至7.2.0版本)。作为一款语音理解和生成一体化的模型,豆包实时语音大模型实现了端到端语音对话,具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应API服务。
IT之家从字节跳动官方获悉,豆包大模型1.5Pro宣称“所有模型训练过程中,未使用任何其他模型生成的数据”。豆包大模型1.5全产品,包括Doubao-1.5-pro,Doubao-1.5-lite,Doubao-1.5-vision-pro等,将继续保持原有模型价格不变,加量不加价。