AI“她力量”:向人类想象更深处漫溯

北青报深一度 2023-03-09 00:49:41

记者/李晶晶

编辑/宋建华

从事深度学习可解释性的研究,是孙莹未来的方向

在每一轮科技浪潮中,女性都是不可或缺的力量。近来,ChatGPT掀起AI领域的大语言模型世界热潮,而百度于2月8日官宣文心一言,中国自研的生成式AI产品将站在全球技术竞赛场上,与世界争锋。

据最新消息,百度将于3月16日围绕其大语言模型文心一言召开发布会,这意味着百度有机会成为全球第一个做出类ChatGPT的大语言模型的科技大厂,而这些意义非凡的背后,都不乏女性学者的参与。AI华人女性青年学者榜显示,近20%上榜学者所研究的方向,与生成式AI、自然语言处理、AI大模型联系紧密。

3月8日,正值国际妇女节,百度发布了首份AI华人女性青年学者榜。榜单从全球范围内评选出80名在AI领域贡献出众的华人女性青年,彰显了科研“她力量”,让越来越多的女科学家们被看见,鼓舞了更多立志从事科研的女研究者。

在浩瀚的技术海洋里,越来越多的女性科研人员成为探索科技边界的舵手,她们热忱、坚韧、细腻,虽然性格不同,但都为人工智能领域注入一股清澈柔和的独特女性力量,引导科学研究向人类想象的更深处漫溯。

“社恐”的AI管理尝试

孙莹一头利落的短发,眉眼清秀,声音爽朗,从小就被爸妈和老师说“投错胎了,生了个男孩。”“长得挺好也不爱收拾自己,不像个女孩。”她自称小时候内向、不善社交,是个“社恐”人,她也经常被亲戚说孩子不会来事儿,内向的性格也让她更想找一个相对独立、可以让人安静思考的专业。

她几乎是被计算机专业“选中”的。幼儿园时,她就去做会计的妈妈班上鼓捣电脑、玩游戏,六年级时她已经可以熟练操作电脑,并在刚上初中时就开始接触编程兴趣班,中学时期,她还能帮亲戚修电脑。对于她来说,跟计算机打交道比跟人打交道要简单,也更能激发探索欲。

爱玩些男生玩的,如打游戏、下围棋等,这是她给同学的印象,年级第一、理工科强也一直是她的标签。2013年到了大学,她也顺理成章地选择了北京理工大学的软件工程专业。她在读喜欢的专业时,几乎没有什么吃力的情况出现,从本科一路读到博士,国家奖学金也一路拿了下去。

因为有天赋、接触编程早,孙莹经常能在课上回答出老师的新问题,班里的男同学们总用“孙大神”来称呼她。2016年,她和班里其他两位同学组成的“大鳄鱼爱洗澡”队还入围了ACM国际大学生程序设计竞赛世界总决赛,在场获奖的选手几乎都是男性,“孙大神”一头短发站在其中,笑得灿烂。

孙莹与计算机为伴、少有社交、一个人做研究的生活,一直保持到大学毕业。2017年,她进入到中国科学院计算技术研究所硕博连读,并进入到百度实习,负责AI人才智库的研究。那时她才真正从计算机的世界里走出来,接触到了很多社会上的人和很多真实的需求,也学习了一些管理学方面的内容。

百度人才智库(Baidu Talent Intelligence Center)简称百度TIC,是百度在2015年组建的专注于“AI+人才管理计算”方向的数据科学团队。旨在通过人工智能和大数据分析手段辅助现代企业的人才管理,推动企业人才管理从经验导向型向数智化导向型的变革,通过智能预测、异常诊断、文本挖掘、社交网络分析、机器学习等数字化技术为人才管理者提供智能化决策建议。

通俗来讲,“AI+人才管理计算”能快速评估一位求职者过往的经历、技能与产出,来匹配合适的薪酬,这将会使企业决策更加透明高效,不再以主观评价的方式选人用人。这也有助于求职者查漏补缺,知晓现在专业对口的劳动力市场上,自己需要提升哪些有针对性的技能,才能获得更好的竞争力。

而在这个系统中,孙莹要做的就是让一切评价尽量客观、可量化,什么样的技能在现在的市场上水涨船高能够赢得更多分值、什么样的经历和职位能更加匹配,AI都能在短时间内迅速寻觅到与岗位最匹配的人。在实习期间,她的AI+人才管理的论文,还发表在了nature杂志的子刊。

模型效果达不到预期,有时一个小代码的错误就会导致数周的努力作废,研究难以继续。这时孙莹往往会通过打两天兵乓球,来让运动释放的多巴胺帮助自己沉静、松弛下来,然后深吸一口气,从头细细捋一遍代码,发现问题再去解决,这其中耽误的是一个月甚至更长的时间。如何度过模型效果不好的瓶颈期,就需要能坐冷板凳的沉着和不焦躁的性子,而这些品格,也是内向另一面的专注力带给她的。

去年,27岁的她进入香港科技大学(广州),成为一名年轻的人工智能学域助理教授。与此同时,她要面临的事务性琐事越来越多,学生时代不想交际、独挑大梁式的研究模式已经不适应现阶段下的工作,带组做课题和多人协作也变得越来越频繁,人际关系沟通的压力也让本就内向的自己压力倍增。

在百度的实习经历让孙莹养成了快速评估人的技能的习惯,带学生时,她脑子里的“模型”会迅速启动,用某一个组员过往的论文、课题、性格表现去评估他适合做什么工种的任务。和大量同行、学生的接触也慢慢纾解了她的“社恐”,不会再用类似“不就是这样做”有点着急的口吻开头,而是耐心去回答学生提出的问题。

她从来不认为女性应该比男性弱,也不认为什么特质就是专属于男性或者女性的。“男性或者女性学者,大家都是凭借成果说话。”但社会角色的差异也会让她听到“女生不用读那么多书”“工作不用那么辛苦”之类反对和劝阻的声音。孙莹说,“如果要形容在这个情况下迎难而上的女性群体,大概都是基于对科研的执着、坚定、热忱吧。”

未来,她还想从事深度学习可解释性的研究,做更多最底层的技术,去支持更多模型更加智能化。“如果可能的话,想做出推动世界的研究。”

李绍园的研究领域是数据挖掘与机器学习

韧如蒲草

如果用一个词来形容科研领域的“她力量”,会是什么?34岁的李绍园语气温柔舒缓,说:“坚韧。”

已经在南京航空航天大学做了4年老师的她觉得,这种坚韧不仅仅是面对挫折迎难而上的坚韧,还是能够平衡工作和家庭的坚韧。

做科研的时候经常周期很长,可能在很多次负反馈之后可能才会得到一点点正反馈,在李绍园的观察中,她觉得女生相较男生在投论文、找工作的失败中抗打击能力更强,更有耐心。

在她从事的数据挖掘与机器学习领域里,最初需要做很多枯燥的数据标注工作,一点点校准、精进,便捷聪颖的人工智能背后是一次又一次的反复模拟和实验。比如,在做自动驾驶的研究中,如何去准确地标注、记录红绿灯,稍有差错就有可能影响最后的研究结果,甚至出现安全隐患。

她笑称,自己一路走来的科研经历,就是从“小白”到“熟练工”的转变——从最基础的数据标注做起,慢慢摸索出规律,再用自己所学的技术将这些规律变为机器语言,让机器更加智能化。

科研人员在研究期间枯燥的工作将会解放更多劳动力,让更多人不再为机械的工作所累。李绍园曾经做过很多应用于实际的研究,比如她负责的一项智慧体育的项目,可以用机器自动评判学生的体测成绩,不再需要人用纸笔去一项项记录;另一项关于钢材自动质量检测的研究,大大解决了质检人员的人力成本,不再需要人辗转于钢材中间一一勘验。但这些便捷技术的生成,前期都需要研究人员做大量重复性的工作。

李绍园在人生体验中的“坚韧”还体现在自己的人生经历上。2006年,她在进入大学选择专业时,IT成为了当时炙手可热的专业,本着“好找工作”的朴素目标,她在南京大学读计算机专业一直读到博士。大学的氛围并不比高中轻松多少,但她觉得那才是真正的“理想国”,所有关于技术的设想都有地方供你思考,都有人跟你讨论。

到后来进入南京航空航天大学工作,她觉得自己已经离家乡河南的那片麦田越来越远。有了忙碌但是有成就感的工作,成为了父母的骄傲,也接触到了最前沿的技术——那是父母不太明白的领域,他们只知道“走出去总是好的,这个专业总不可能失业。”李绍园在遇到扫地机器人或者智能音响等,能应用上人工智能技术的产品时,才能向他们骄傲地解释“看,我就是做这个的。”

去年,她迎来了自己的孩子,度过了一段甜蜜但艰辛的母职期,这或许是所有想要生育的女科学家们都需要面临的问题——孩子在3岁以前天然亲母,情绪也不可控。李绍园说:“这无关家庭分工,孩子小的时候就是需要母亲大量的陪伴。”但这时,女科学家们的科研精力就会有所分散,公认的30-40岁的黄金研究期,也会被孩子占掉很多时间。很多工作都不得不从白天挪到夜晚孩子睡着以后,这才能觅得一点静谧研究的时光。

孩子的出世也让她重新审视了自己所从事的工作,并从中获得了新的体验:“机器训练和婴儿的训练一样,前期都是一张白纸,就像研制一个扫地机器人一样,都需要大量的调教、学习、刺激、障碍训练,才能真正意义上听懂人之所需,理解人之所想,达到真正的智能。”

未来,她更想成为一个能够平衡好科研和家庭的人,“我想至少让大家知道,至少让身边的人知道,女性不是成家以后就不搞研究了。成为母亲能让我获得更宽阔的生命体验,也是我想要的,虽然育儿与工作确实很难平衡,但是我想做好。”

有了什么样的结果,都用“坚韧”去面对,是她的人生哲学。上大学前基本没摸过电脑的她,在应对难学的计算机专业时是这样、有了家庭要平衡事业时也同样是这样。

“未来的女性力量一定会更自信、更团结、更有影响力,十年后或者更以后的时间,我应该还会在学校从事教学和科研等相关工作,持续探索,为科研事业贡献自己的力量。”

张静未来可能更深入地研究结合结构化形式的知识图谱和大模型

终身学习 终身求变

与前两位一路读到博士的女科学家不同,张静是硕士毕业后,在企业做了两年开发岗位的工作,才真正知道自己想要什么。

“工作时做项目,需要比较广的知识面,各种知识和技能都需要了解但总各方面深度都不够,我就是想去在某一个点做深入耕耘。”

2012年,彼时她已经工作了3年,还有了一个一岁的孩子,她做了一个勇敢的决定,“孩子出生不久我又回到清华,读了博士,白天做研究,晚上快速陪陪娃,真是一段异常难忘的时光,非常感谢家里老人的支持。”张静坦言,到现在她也不能说自己能够平衡家庭和科研,只能说尽力了。

她能听到旁人评价她最多的,就是“拼”字,闲暇时间虽然少,但是当老师可以自主把握工作内容和节奏、自己说了算,还是一件很幸福的事情。

在张静看来,做科研就像小孩子搭积木,首先要想清楚目标,做什么、搭什么,进而要不断地尝试各种形状的积木和各种方式的组合,搭好了之后要推一推、吹一吹看看是否结实、功能上是否满足目标、外观上是否大方美观。做研究也是,方法建立之后,需要严谨的理论或实验验证,证明其可靠性。

博士毕业后,张静在中国人民大学信息学院留教至今。一年前,张静在尝试GPT3大模型时还会对自己的小模型很自信。“毕竟大模型精度不够,也考虑不了很多特殊的需求。”

她让大模型写一段SQL语句(结构化查询语言,用于存取数据以及查询、更新和管理关系数据库系统),比较自己研究的小模型后,她会觉得还有很多漏洞。没想到仅一年多的发展,大模型再写出的SQL语句泛化性就极强了,甚至全面碾压小模型。

今年,ChatGPT掀起AI领域的大模型世界热潮,这让张静感到危机感重重:“这意味着我们过去所研究的许多面向特定任务的小模型受到很大冲击,难以为继。”

但机遇也带来更大的挑战,未来,张静或许会做一些更深入的结合结构化形式的知识图谱和大模型的研究,让大模型更加智能。

张静给出了一个生动的例子,“如果没有更新的语料或知识图谱,你问人大新换的校长是谁,大模型可能会给你去年的数据。”而她想要做的,则是将大模型的回答变得更有事实性和时效性。“结构化数据本身很大的优势就在于它能够支持比较精准的复杂逻辑操作,但是大模型恰恰是缺乏这种能力的。所以如果把这两者结合起来的话,我觉得它可以落地到更多有意义的业务场景上去。”

张静用了一个非常生活化的场景来打比方,“比如像我们想制定全家人的度假计划,需要打开各种吃、穿、住、行的APP,还需要进行各种比对、分析和决策,整个过程需要认真做功课,还是相当复杂的。但大模型的进步让我们有了更大的畅想,或许以后我们每个人都有一个个人秘书,你只需将你的基本需求告诉她,她就可以完成包括出游地点、订票、食宿、游览路线等一系列详细规划,还可以根据你的反馈给出修改方案。而这样的局面,说不准再过一年就会实现。”

据最新消息,百度将于3月16日围绕其大语言模型文心一言召开发布会,这意味着百度有机会成为全球第一个做出类ChatGPT的大语言模型的科技大厂。

人工智能领域技术的迭代是如此之快,研究者们也必须保持终身学习的姿态才能跟上潮流的发展。这也是为什么这些女研究者的家人们时常不理解,“你一个老师、做研究的,为什么一天这么忙。”“为什么都读完博士了还不能歇一歇,有个清闲的工作。”

选择做科研,也意味着选择了更有挑战性的一条路。也正因为科研的道路不会一帆风顺,在一开始对这项有挑战性的事业燃起热情时,她们在准备好接受鲜花的同时也预备好了一路披荆斩棘。

在百度发布的往期华人青年学者榜单中显示,在AI经典领域中,女性学者的主要研究主题同青年学者差别不大,这表明女性学者在AI领域各个方向都能展现出同等的研究价值和贡献,但在图像理解、细节敏锐度以及感知情感等方面具有先天优势。

像孙莹、李绍园、张静这样的女性科学家一直走在探索的道路上,为人工智能领域注入了一股热忱、细腻、坚韧的力量。

自百度成立以来,在AI领域始终处于领先地位,除了投入大量的研发成本外,还非常关注AI领域人才的培养和挖掘。由百度学术和百度人才智库发起的AI人才榜单项目已运营两年有余,先后发布了《2021AI华人新星百强榜》、《2022AI华人青年学者榜》,这些都是百度“500万AI人才培养计划”中的重要组成部分。

3月8日正值国际妇女节,百度发布了首份AI华人女性青年学者榜。榜单从全球范围内评选出80名在AI领域贡献出众的华人女性青年,AI华人女性青年学者榜显示,近20%上榜学者所研究的方向,与生成式AI、自然语言处理、AI大模型联系紧密。

孙莹认为,入选榜单能够让更多学生知道女老师也有着很大的影响力、做了很棒的研究;李绍园觉得,这激励了想要从事科研的女学生们能一直学习下去;张静则想,这对做了多年科研的女性来说,是一种莫大的鼓励。

在这三位女性读博时,计算机学院里的男女比例非常悬殊,女博士少之又少。但随着女性意识的觉醒、女生做科研的常态化,已经做了老师的她们可喜地发现学院里读博的女生越来越多,而在这些新生力量当中,或许就存在着未来能登上榜单、改变AI领域甚至影响世界的女性。

【版权声明】本作品的著作权等知识产权归北京青年报【北青深一度】所有,未经授权,不得转载。

0 阅读:25

北青报深一度

简介:为认知变革中国提供纵深阅读文本