编辑 | 伊风
出品 | 51CTO技术栈(微信号:blog51cto)
没想到,闹得纷纷扬扬的字节实习生大模型「投毒」事件,竟然等来了后续!
据媒体报道,北京市海淀区人民法院已正式受理字节跳动对前实习生田某某的起诉!
田某某篡改代码的代价相当惨重。字节跳动的诉求是:法院判令田某某赔偿侵权损失800万元及合理支出2万元,同时要求其公开赔礼道歉。
这个实习生到底闯了多大的祸,让字节跳动没有咽下这口气,而是选择高调起诉、杀一儆百。
简而言之,他因为团队资源分配问题产出不满,便选择报复公司。以一己之力篡改代码,让整个团队一个月的模型训练“白干了”。
咋做到的呢?这人不仅技术够硬,还懂点潜伏:
“利用huggingface的load ckpt函数的漏洞注入代码,动态修改别人的optimer随机sleep一小段时间,以及修改参数梯度的方向,而且他还加了个条件,只有256卡以上的任务才会触发这个条件,问题是他还潜伏在集群debug群里,查到啥就改啥,极致攻防。”
图片
在字节跳动发布的澄清中,这事虽然没有损失8000多卡、上千万美元这么夸张。
图片
但也是实习生能捅出的“摩天大篓”了。
1.事件时间线回顾:对资源分配的不满终酿成大祸2024年6月至7月
事件发生:字节跳动的一名实习生田某某因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。
2024年8月
实习生被辞退:字节跳动与涉事实习生解除实习协议,并将其行为同步给所在学校和行业联盟。
2024年10月
有人在社媒爆料,并被媒体进一步报道:称“字节大模型训练任务被实习生攻击”,并有网传信息称“涉及8000多卡、损失上千万美元”。
字节跳动澄清:字节跳动通过官方账号发布事实澄清,称确有实习生发生严重违纪,涉事实习生已于2024年8月被公司辞退。同时指出,相关报道存在部分夸大及失实信息:受影响的是公司商业化技术团队某研究项目的模型训练任务,不影响公司正式项目及线上业务,且“涉及8000多张卡、损失上千万美元”的传闻属严重夸大。
2024年11月5日
内部通报:字节跳动发布面向内部全员的《企业纪律与职业道德委员会通报》,对该事件进行披露。
2024年11月27日
法院受理案件:北京市海淀区人民法院正式受理字节跳动对前实习生田某某的起诉。
索赔要求:字节跳动请求法院判令田某某赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。
2.插曲:高才实习生拒不认错,字节跳动忍无可忍字节跳动发生的这桩大模型投毒案令人唏嘘。据悉,田某某本科毕业于北京航空航天大学软件学院,研究生就读于北京大学,研究兴趣为深度学习的优化与算法。
他有着过硬的技术实力,却没有用在有价值的产出上,反而走向了攻击训练成果、报复公司的歧途。
他“抽象”的行为也被很多网友热议。在事情曝光后,他没有承认错误,而是称被人诬陷,甚至报警称遭到了造谣。
这种恶劣的态度,也给了自己一记回旋镖。
字节跳动内部人士表示,考虑到田某某完全没有意识到错误,且涉事行为已触犯公司安全红线,公司最终决定向法院起诉,以表明公司严肃态度、杜绝类似事件再次发生。
3.写在最后:大模型“投毒案”如何“杀一儆百”800万的天价数字,是字节跳动希望引起社会关注的筹码。
但作为一个在读博士,田某某 800 万的赔偿一旦判下,将是沉重的负担。此外,田某某的工作生涯可能受到巨大的影响,对于用人单位来说,职业道德的缺陷比工作能力不足更难补全。
不过,法院将如何判决,最终结果可能需要数月的等待。
回到案件,实习生捅出的大篓子,让很多人惊讶于字节给实习生的权限之高,也揭示了成熟的科技巨头所存在的管理漏洞。案件能警示更多技术团队,完善制度(权限分级、代码审查、日志追踪),在提供实习生成长机会和保障核心资源安全取得平衡。
同时,因为感到资源分配的不公,就决定给公司带来毁灭打击的田某某,折射了常见的职场竞争问题,和与之带来的浮躁情绪。
企业和个体共同反思、改进,比单纯的惩罚更有意义。多一点心平气和,鼓励合规且有效的方式表达不满,不让技术再次走向歧途。
来源: 51CTO技术栈