被字节起诉攻击模型训练的实习生,获人工智能顶会最佳论文

南方都市报 2024-12-04 12:28:49

人工智能领域顶级学术会议NIPS2024最佳论文近日出炉,北京大学和字节跳动团队一篇关于视觉自回归模型的论文位列其中。而该文的第一作者,正是此前被字节跳动起诉索赔800万元的前实习生田某某。

所谓自回归模型,其原理是基于序列前面的值(上下文)来预测生成后面的值,如GPT等大语言模型就是典型的自回归模型。

北京大学和字节跳动团队这篇获奖论文,则展示了自回归模型在图像生成领域的潜力。该文提出名为VisualAutoregressiveModeling(VAR,视觉自回归模型)的新型图像生成范式,能够快速学习视觉分布,并具有良好的泛化能力,从而验证了在图像领域,VAR模型也拥有自然语言处理领域自回归模型的扩展定律(ScalingLaw)和零样本泛化能力。

具体效果上,VAR模型的图像生成质量、推理速度和可扩展性等性能,超越了图像生成领域中常用的扩散模型(DiffusionTransformer)。而在VAR模型提出前,自回归模型在图像生成领域的表现显著落后于扩散模型。

NIPS(神经信息处理系统大会)每年12月举行,被视为机器学习领域最具影响力的会议之一,与ICML(国际机器学习大会)齐名。2024年的NIPS将于12月10日至12月15日在加拿大温哥华召开。

上述获奖论文受到外界关注,部分缘于作者身份。在字节跳动实习期间,北京大学在读博士生田某某以第一作者发表这篇论文,但目前已陷入和字节跳动的司法纠纷。

南都11月27日报道,字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理,案由为侵权责任纠纷。字节跳动请求法院,判令田某某赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。(详见:前实习生篡改代码攻击大模型训练,字节跳动起诉索赔800万)

谈及起诉缘由,字节跳动内部人士介绍,由于田某某为在读博士生,公司将其辞退后首先交由校方处理。但在事件处理期间,田某某多次对外否认,称攻击模型训练任务的不是自己,而是别的实习生。考虑到田某某完全没有意识到错误,且涉事行为已触犯公司安全红线,公司最终决定向法院起诉,以表明公司严肃态度、杜绝类似事件再次发生。

11月5日,字节跳动内部通报披露,2024年6月至7月,集团商业产品与技术部门前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。公司已与其解除实习协议,同步阳光诚信联盟及企业反舞弊联盟,并同步至其就读学校处理。

南都记者多次通过邮箱、社交平台等渠道和田某某联系,均未收到回复。

采写:南都记者杨柳

17 阅读:4131

评论列表

strong

strong

35
2024-12-04 14:54

有才无德,危害更大,芭比Q了,可惜了之前的辛苦付出。

纵使相逢应不识

纵使相逢应不识

33
2024-12-04 21:15

就算获了最佳论文,以后找工作也困难,哪个公司敢用这种白眼狼啊…这种人的职业道德有严重的问题…

如晴天 似雨天

如晴天 似雨天

18
2024-12-04 17:54

一个实习生竟然能接触到公司的核心[静静吃瓜]

废废小女孩

废废小女孩

14
2024-12-04 14:51

品德不行,能力越强可能破坏越大。

洛荨苳

洛荨苳

11
2024-12-04 18:55

就凭这论文,去美国名校读个博后没问题吧!加油

用户16xxx16

用户16xxx16

8
2024-12-04 14:45

你的才华才能才干,可以高到让大家自动忽视你在人品德行方面比较自负和极端的程度吗?

zyinfan

zyinfan

8
2024-12-04 15:36

静待后续发展…

天园地方

天园地方

5
2024-12-05 08:46

思想不端正,越厉害越危险!对谁不满就攻击谁,岂不养虎为患。

轩辕娜都

轩辕娜都

5
2024-12-04 15:28

这很正常,如果他是普通打工人,字节跳动不可能让他接触损失能达到800万元的项目。

whiteangel

whiteangel

4
2024-12-04 14:48

有两把刷子

素心 。

素心 。

4
2024-12-04 18:50

出国混吧!就凭这篇论文找一份好工作不成问题

刘二哥

刘二哥

3
2024-12-04 14:40

不厉害是不会被起诉的

春雨

春雨

2
2024-12-04 14:53

[得瑟]

LoonG

LoonG

2024-12-05 12:38

北京大学教出来的好博世

南方都市报

南方都市报

换一种方式,南都在现场。