掘金浪潮中,最先赚到钱的,一定是卖给掘金者“铲子”的人。
Scale AI 就是美国AI热潮之中,最为引人瞩目的“卖铲人”。
Scale AI由Alexandr Wang和Lucy Guo于2016年创立,专注于为用于训练 AI模型的数据添加标签,总部位于美国旧金山。
通俗来讲,AI大模型的建立,需要海量的数据“喂养”,Scale AI扮演的角色就是帮助AI大模型公司寻找数据、处理数据、提供数据,这个行业被称为“数据标注”。几乎所有涉及到AI大模型的公司,都可以是其潜在客户,被称为AI领域的“富士康”。
成立八年来,Scale AI成绩单异常亮眼:
包揽多家头部自动驾驶车企的服务,谷歌的Waymo、丰田汽车是它的拥趸;2020年起,从美国国防部处拿下了多个天价订单;2023年的年化收入较前一年翻3倍,达到7.5亿美元;迄今为止,已经在9轮融资中共筹集了16亿美元资金……
随着AI产业迎来风口期,Scale AI水涨船高,脱颖而出。
5月21日,Scale AI完成新一轮10亿美元融资,估值飙升至138亿美元。其华裔创始人Alexandr Wang,1997年出生,被称为下一个“扎克伯格”。
下一个“扎克伯格”?Alexandr Wang出生于美国新墨西哥州,父母都是Los Alamos National Lab的物理学家。他的名字从Alexander去掉了一个e,因为父母想让他的名字刚好有8个字母,8在中国代表着好运。
Alexandr小时候就对计算机表现出浓厚的兴趣。中学时参加编程比赛,因为表现突出,陆续收到多个硅谷科技公司的offer,17岁开始在Quora担任程序员,在那认识了同样辍学的Lucy Guo。
Lucy 1994年出生于迈阿密,高中毕业后进入研究型私立大学卡内基梅隆,主要学习计算机科学和人机交互。2014年,20岁的Lucy获得10万美元的辍学创业奖励资助Thiel Fellowship。
Thiel Fellowship由“硅谷创投教父”Peter Thiel创立,是众多奖学金中的“异类”。
Thiel Fellowship每年会从全球挑选20多名想辍学创新的学生,为他们提供10万美元、人脉以及企业导师,邀请他们去硅谷创业。这10万美元没有任何附加条件,Thiel Fellowship不拿股份,也不是投资人。Lucy抓住了这个机会。
两个经历类似的年轻人,总会碰撞出很多奇妙的想法。
进入大学前,Alexandr分别在Addepar、Quora和Hudson River Trading工作了一小段时间。硅谷的实习经历,让他发现机器学习和人工智能技术已经进入早期应用,未来很有可能会掀起一场技术革命。
2015年,18岁的Alexandr考入麻省理工学院,攻读机器学习专业。很多同龄人上大学前对于自己要学什么没有清晰的概念,需要上了大学之后再去了解和探索。而他在上大学前已经有了丰富、专业的工作经验,他是带着对行业的问题和想法去上学的。
大一满绩之后,他选择了辍学。2016年6月,19岁的Alexandr和22岁的Lucy在美国创业孵化器Y Combinator的资助下联合创立了Scale AI。
时任Y Combinator总裁的 Sam Altman是现任 OpenAI CEO,Y Combinator为Scale AI提供 12 万美元的资金,拿到了ScaleAI 7%的股份。
“创办Scale AI的原因是为了解决人工智能中的数据问题。”Alexandr说,“我当时的想法是,我知道怎么写代码,所以我们要去做这件事。”
数据标注的风口在AI领域,公认的三个基本支柱是:数据、算法和算力。
算法领域,前有谷歌、微软的大型研究院,后有推出过Sora和GPT系列模型的OpenAI;算力领域有供货全球的英伟达;但在当时,数据领域仍处于空白。
大部分数据都是非结构化的,AI很难直接学习这些数据。另外,大型数据标注是一项劳动密集型工作,被认为是科技领域最辛苦、最卑微的部分。
从时间刻度来看,Scale AI成立的2016年,正是无人驾驶的关键一年。科技杂志《连线》称“2016年是无人驾驶接过方向盘元年”。
从谷歌到Uber,从特斯拉到福特,各种大大小小的创业公司,无论是做车的还是做技术的,都在死磕无人驾驶。
“我们知道要帮助无人驾驶系统识别路况,需要大量的视频图像数据,因此整个行业急需有人来做数据标注。”
Scale AI一成立就赶上了好时机,加入自动驾驶汽车领域就像抱到了一棵摇钱树。
据《福布斯》2019年6月的一份融资宣传手册显示,Scale AI的客户名单包括Meta、OpenAI、微软等科技巨头,以及Alphabet自动驾驶汽车公司Waymo、通用汽车的Cruise、丰田汽车Toyota、Uber等巨头。
大部分做过无人驾驶的公司都是他们的客户,仅苹果自动驾驶部门的一个账户就为他们带来了超过千万美元的收入。
AI界“富士康”Scale AI的创业之路也并不是一帆风顺。当Scale AI主导了自动驾驶汽车公司的数据标签市场时,难题来了:它的规模越大,不仅难以跟上对人力的需求,平均雇佣培训和管理成本也逐步攀升。
于是,一个叫做Remotasks的人力资源子公司应运而生。
由于需要廉价劳动力,Remotasks专门负责在肯尼亚、菲律宾和委内瑞拉等非洲和东南亚地区建立了十几家工厂,以培训大量的数据标签员。
数据显示,2018年初,Scale AI的毛利率在65%左右徘徊,到第四季度降到仅30%左右;但Remotasks为其提供廉价的国际劳工后,到2019年年中,Scale的利润率已恢复到69%。
有报道称,Remotasks上的大部分工作都是按件计酬,一项任务的收入从几美分到几美元不等,因为有些任务可能只需几秒钟,而有些任务需要几小时,所以工资很难标准预测。
标注员们表示,Remotasks刚进入肯尼亚时,他们的报酬相对较高,平均每小时大约为5到10美元。但随着时间,报酬逐步下降。而美国的Remotasks标注员通常每小时能挣10到25美元,一些专业标注领域的专家报酬则会更高。
“非洲劳工的时薪低至1美元。”
Scale AI被贴上了“AI界富士康”的标签,这是它颇具争议的一件事,所以Remotasks一直被小心翼翼地定位为一个独立的品牌。
为了摆脱人工标注的限制,一段时间探索之后,Alexandr和Lucy意识到他们可以通过标注大量数据(包括文本、图像和视频)训练机器学习模型,让Scale AI的数据标注业务“AI化”。
由此,Scale AI开启了从纯人工标注到AI标注的转型之路,这也成为Scale AI发生“质变”的转折点。
AI化之后的Scale AI,已经不再是单纯的数据标注公司,而是转型成为以数据标注为基础的应用开发平台。这也意味着,Scale AI的业务范畴,从此前简单的数据处理服务商,蜕变成为数据管理、分析以及模型搭建服务商。
从AI数据服务商到AI模型服务商,自我的AI化变革,使得Scale AI跳脱出数据标注这个劳动密集型、低技术含量的行业限制,成为一家真正“值钱”的高科技公司。
以宏观视角来看,Scale AI对于时机的把握异常精准。在无人驾驶的风口中,他们完成了基本盘的构建与转型。当无人驾驶热潮退去后,以ChatGPT为代表的生成式AI热,又给Scale AI带来了新一波机会。
包括OpenAI在内的一大票客户找上了门,连美国国防部都成了Scale AI的客户。
到2023年初,Scale AI规模扩展到700人。Alexandr在接受《财富》杂志独家采访时透露,随着企业客户竞相训练生成式AI模型,Scale AI这方面业务快速增长。这一年,公司年度经常性收入(企业长期为数据服务支付的费用)增加了两倍。
2024年5月,最新的10亿美元F轮融资,进一步推高了Scale AI的估值,达到了138 亿美元。由Accel 领投,几乎所有的现有投资者均参与其中,包括英伟达、Y Combinator、Spark Capital 以及 Peter Thiel 的 Founders Fund 等,与此同时,加入的新投资者包括亚马逊、英特尔、思科、Meta等。
Scale AI用5年时间实现估值从0到超70亿美元,然后又用3年时间将这一数字翻倍。
Peter Thiel高度评价Scale AI:“在激烈的竞争中,AI公司们会出现又消失,但是Scale会一直存在。因为Scale提供的是整个AI/ML行业的基础设施,数据是这个行业最重要的东西。”