据媒体报道,因恶意攻击字节训练集群,而被起诉赔偿侵权损失800万元及合理支出2万元,并公开赔礼道歉的实习生田某某,获得了NeurIPS2024的最佳论文奖。
其在字节跳动商业化技术部门实习期间,与团队合作发表了这篇获奖论文,该论文在NeurIPS2024中排名第六,得分达7,8,8,8。该事件引发广泛热议,一方面因为NeurIPS本身在行业内的影响力,另一方面因字节刚请求法院判令田柯宇赔偿公司侵权损失800万元及合理支出2万元。
据公开信息显示,NeurIPS(全称神经信息处理系统大会,ConferenceandWorkshoponNeuralInformationProcessingSystems)是专注于机器学习和计算神经科学的国际会议。该会议由NeurIPS基金会主办,通常在每年12月举行。在中国计算机学会的国际学术会议排名中,被列为人工智能领域的A类会议。2020年,OpenAI团队发表的《DALL-E:从文本创建图像》也获得了最佳论文,是文本生成模型领域的重大突破。
此次NeurIPS公布的最佳论文由田柯宇所在的字节商业化技术部门与北京大学合作发表,论文题目《视觉自回归建模:通过下一尺度预测实现可扩展的图像生成》,由包括田柯宇在内的五人完成,田是第一作者,核心内容探讨一种可扩展的图像生成方法,通过下一尺度预测(Next-ScalePrediction)来进行视觉自回归建模(VisualAutoregressiveModeling,简称VAR),是一种用于创建新图像数据的生成模型。
VAR在图像生成领域具有创新性,因为它首次使得GPT风格的自回归模型在图像生成方面超越了扩散模型,此前持续刷屏的DALL-E3、StableDiffusion3、Sora等模型均属于Diffusion类型。一位国内头部人工智能机构负责人此前对记者表示,字节与实习生爆发的矛盾,本质在于技术路线的争端引发的资源分配问题。截至发稿,字节方面暂未对矛盾原因进行回应。
上个月,字节跳动起诉前实习生田柯宇篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院判令田柯宇赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。
在11月5日的字节跳动《企业纪律与职业道德委员会通报》中,官方解释内部模型被“投毒”经过:2024年6月至7月,集团商业产品与技术部门前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。
但当时的处理方案主要是字节跳动与该实习生解除实习协议,同步阳光诚信联盟及企业反舞弊联盟,并同步至其就读学校处理。几个月后双方矛盾激化到起诉环节,字节跳动内部人士向记者解释原因称:由于田柯宇为在读博士,公司将其辞退后首先交由校方处理。但在事件处理期间,田柯宇多次对外否认,称攻击模型训练任务的不是自己,而是别的实习生,甚至报警称遭到造谣。考虑到田柯宇完全没有意识到错误,且涉事行为已触犯公司安全红线,公司最终决定向法院起诉,以表明公司严肃态度、杜绝类似事件再次发生。
NeurIPS2024最佳论文披露后,外界猜测字节方面的态度、田柯宇会否进行创业、相关技术的具体落地进展等。但目前字节与田柯宇之间,还有一桩诉讼待解决。
(齐鲁晚报·齐鲁壹点客户端编辑武秀英综合第一财经、快科技)