聊聊中国大模型:awesome-LLMs-In-China

说个云也原生 2024-03-19 06:05:18

随着两会上的热议,“大模型”这个词最近出走科技圈频频出现在公众的视野里,但很多人被这个词的专业感拒之千里,以至于一直不清楚大模型究竟是什么以及大模型会为我们的生活带来哪些改变?今天这篇文章我们一起聊聊大模型,一探究竟。

什么是大模型?

大模型是指参数规模非常庞大的机器学习模型,而由于其参数的庞大,所以可以应用处理很多复杂的场景,且具备准确率高、效率高的特点。结合模型的书面定义:通过主观意识借助实体或者虚拟表现,构成客观阐述形态结构的一种表达目的的物件。(物件并不等于物体,不局限于实体与虚拟、不限于平面与立体)。而“大”体现在模型中使用的数据。

大模型如何构建?

大模型的构建需要使用大量的数据进行训练,这些数据包含了各种复杂的特征和规律,因此大模型具有更好的预测性能和更高的准确率。其次,大模型的计算算法也比较复杂,需要使用分布式计算框架和高效的并行计算技术来实现。这些技术可以极大地提高模型训练和预测的速度,使得大模型能够在更短的时间内完成训练和预测。最后,大模型还具有较高的可扩展性和适应性,它可以不断地学习新的数据和规律,不断地优化自身的预测性能和准确率。

大模型可以用在哪些领域上?

大模型目前已经在许多领域得到了广泛的应用,比如自然语言处理——翻译、问答、文本领域;计算机视觉——图像分类、图像识别领域;推荐系统——推荐内容、推荐产品领域。

以之前火爆出圈的的GPT为例,GPT属于在自然语言处理领域表现出了极强的能力,可以准确地理解人类语言的含义和需求,并且实现了真正的人工智能交互,而针对RPA赛道,关于大模型的问题,也有很多值得探究的地方。

大模型的发展彰显了人工智能时代的魅力,而自然机器人也会持续钻研迭代自身的产品能力,不断推进与大模型在更多领域的结合,充分发挥各自的优势,助力更多企业降本提效、数智转型。

国内大模型落地现状

目前来看,国内大模型这两年如春笋般闪现,大家都处于摸索阶段,盈利能力微弱,大模型落地金融、能源行业先行,智能客服等生成类应用大于决策类应用,外加语种翻译、图片生成,落地价值不及预期。然而随着行业定制化、模型轻量级化和数据安全化等技

术的发展,AI大模型的落地应用将迎来更加广阔的发展空间。

分享几个头部的AI大模型

序号

公司

大模型

省市

类别

官网

说明

1

百度

文心一言

北京

通用

有APP

2

智谱华章

清言

北京

通用

有APP,开源模型ChatGLM3-6B, ChatGLM-6B和ChatGLM2-6B

3

百川智能

百川

北京

通用

开源小模型baichuan-7B和Baichuan-13B,baichuan-2

4

阿里云

通义千问

浙江杭州

通用

开源模型Qwen-1.8B,7B,14B,72B、Qwen-VL和Qwen-Audio

5

上海人工智能实验室

书生

上海

通用

开源模型书生·浦语-7B,20B

6

达观数据

曹植

上海

工业

试用需账号

7

深度求索

Deepseek Coder

浙江杭州

代码

8

科大讯飞

星火

安徽合肥

通用

有APP

9

春田知韵(抖音)

豆包

北京

通用

开源多模态7B模型BuboGPT,豆包是云雀的聊天机器人

10

中国科学院自动化研究所

紫东·太初

北京

通用

紫东太初2.0号称100B参数,全模态

大模型会走向哪里,如何变现,欢迎大家讨论

0 阅读:0

说个云也原生

简介:感谢大家的关注