AI女科学家:我们的浪漫在选择里

北青报深一度 2023-01-10 22:35:22

记者/李晶晶

编辑/计巍

吴华在参加全球人工智能技术大会

让齐天大圣穿上西装,让熊猫在街边撸串儿,让万亿次的计算归于一瞬……三位不同年龄的女科学家,用自己浪漫的想象和日复一日的努力,创造出了现实“以外”的场景,也让技术更加便捷、迅速,让不可能变为现实。

在百度,浩瀚的技术海洋中,这些女性细腻和敏锐的力量正在向科技领域的更深处探索,试图将科技的边界拓展得更宽。

一个人,成为一支队伍

“大模型的进步,让我们在文字、图像、视频等创作领域全面感受到AI技术的魅力,一个人就可以完成编剧、美术创作及后期剪辑等内容创作全流程工作,成为天才创作者,再配上自己设计的虚拟演员,那你就可以成为真正的‘独立导演’。”

讲述人清秀瘦小,一头利落的短发,说话时略带南方绵软的口音,语气温柔坚定。她是吴华,1974年出生的她,已经是百度技术委员会的主席。1月5日,在百度“AIGC(AI-Generated Content,即AI生产内容)智能创作新风尚”座谈会上,她介绍了百度AIGC内容生成能力背后的技术原理。

吴华是自然语言处理、机器翻译、人机对话、知识挖掘、机器学习等领域的专家。曾经负责的百度翻译项目翻译质量处于世界领先水平,并获国家科学技术进步奖二等奖。吴华在语法语义分析、机器学习、人机交互、自动问答等方向上进行了多项创新,成果已应用于许多产品。

最近,她主导了百度文心ERNIE 3.0 Zeus的设计,在这项技术中,创作者只需输入一个题目,它就可以瞬间结合语境写出上百篇不同体裁、风格的作品,甚至是完成剧本创作。

百度文心ERNIE 3.0 Zeus也可以根据一句话或一段描述文本,生成写实、意象、中国风、二次元等不同风格的精美画作,它甚至可以生成现实世界中没有的创造性的图像,比如穿西装的齐天大圣、街边撸串儿的熊猫……让人们天马行空的想象力得到精准的可视化呈现。如果再通过百度专门的视频内容生成与编辑技术对该画作或者视频进行剪辑加工处理,就可以得到全新或者更加精美的视频。

2022年以来,随着谷歌、百度、Meta、微软等国内外企业先后推出自己的AI绘画模型或者平台,AIGC这一新型内容创作形式,获得了越来越多的关注。因此,2022年也被看做是AIGC发展的元年。

百度创始人、董事长兼首席执行官李彦宏也曾指出,“过去一年间,人工智能无论是在技术层面还是在商业应用层面,都有了巨大的进展,有些甚至是方向性的改变。”而在诸多被提及的方向性改变中,AIGC成为了被重点提及的对象。

吴华说:“有很多电视剧的剧本并不是由一位编剧单独完成的,而是由一位总编剧制定总纲,再制定每一集的大概内容,再交给多位编剧分别写每集的具体对话、详细故事。因此,如果一个人能编制一部电视剧的总纲,他便可以把每一集的要求交给ERNIE 3.0 Zeus生成故事,然后再经过合并整理最终写出整部剧;在看刑侦影视剧的时候,经常看到警察向目击者询问嫌疑人的长相,然后用铅笔画像,警察要理解目击者语言所表达的意义,再转换成素描画像。现在,我们的模型也具有这种能力。”

每一次内容生成的背后,都需要科学家精细的算法支持来“调教”AI。

在做百度翻译时,吴华就曾举过一个例子——“how old are you”可能会被翻译成“怎么老是你”,而百度翻译就能够智能甄别和过滤,并给出正确的翻译结果。在AIGC中也是一样,每一次人物表情、动作的生成,都需要科学家们在背后一点点归类、校准,模仿出人的真实状态。

女科学家的细腻和敏锐,让她在遇到需要把握宏观技术方向和技术难题时,有着特殊的优势。吴华善于为团队指出可行的方向,引导成员打开思路,加入创新思维。她也擅于关注到每个成员的工作细节,给予具体指导和启发,在她的影响和带领下,百度技术团队研究成果和产出显著。

陈澄在介绍超导量子计算机“乾始”

乾始” " dc47e4e8-0776-0777"="">一秒,万亿次的计算

在百度量子实验室内,虽然只能听到机器运行的轻微噪声,但在庞大的白色外壁内,却藏着另一个飞速运行的世界——超导量子计算机“乾始”。

穿着白色防护服、戴着蓝色鞋套穿梭在实验室里的,是百度量子计算研究所高级研究员陈澄。她博士毕业于北京大学,近10篇论文被国际顶级学术期刊收录发表。现在,她投身于量子计算硬件测控平台的研发搭建工作。

2022年8月25日,百度对外发布超导量子计算机“乾始”,并推出全球首个全平台量子计算软硬一体化方案“量羲”。这标志着百度量子作为中国量子计算产业化先锋,成为国内首家实现量子产业应用的企业,使中国量子计算产业化进入全球第一梯队。

“乾始”和“量羲”的出现,降低了量子产业应用门槛,让量子算力触手可及

,让普通人可以在应用市场下载量子计算平台“量易伏”APP。“量易伏”实现了量子计算和云计算的融合。用户可以在页面应用“量子作曲家”模块,并选择在量子模拟器或量子计算机上,“跑”一个自己的量子程序,亲身感受量子计算的魅力。

在信息安全领域,若要破译RSA公钥密码系统,经典计算机需要10万年以上计算的时间,而量子应用则仅需1秒。

量子软硬一体化是百度量子实验室一直致力做的事。这意味着从硬件、操作到应用软件的全流程打通。在这个过程中,神秘的微观量子世界,可以到达我们可感知的宏观世界,展现在我们面前。但这其中涉及成千上万的技术细节,环环相扣,任何环节的失败都会让整个桥梁功亏一篑。

为了攻克难题,在研发过程中,和陈澄一样的研究人员需要设计特殊的芯片结构,让其具备产生可控量子效应的能力,通过反复的计算尝试操控量子比特的最佳参数,并让制冷机在非常接近绝对零度的环境下,实现量子比特,进而将人类可以理解的程序语言编译成机器可以理解的语言,设计量子算法,最终将这些算法恰到好处地应用在其能发挥作用的问题上。通过这一系列的努力,才能实现量子算力到生产力的转化。

或许普通人并不能理解比经典计算机更优秀的量子计算意味着什么,但不妨把眼光放得更为宽阔一些,量子计算其实能够应用于各行各业。

陈澄谈到了自己的设想:“量子计算有助于加快药物研发的速度。很多疾病是源于这种蛋白质的错误折叠。根据它折叠的规律,计算是很难的,这就需要强大的算力。量子计算就可以帮助预测蛋白质的结构,加快药物研发的过程,降低试错的成本。再如期权定价、投资组合优化等需要大量计算的金融行业、化学领域,量子计算都有用武之地。”

洪逸宁在2022国际人工智能顶尖会NeurIPS上介绍自己的论文

一次偷懒,永远的探索

刚刚获得百度奖学金的1996年出生的女生洪逸宁,正在加利福尼亚大学洛杉矶分校读计算机科学博士,她是人工智能领域的女性新生力量,而让她坚持这条路的契机源于一次“偷懒”的想法。

大三时,她负责运营学院的一个学术型公众号,当时写一篇整理学术热点的公众号文章,就需要耗费两三个星期,看上千篇的论文。有一天,她写文章写烦了,就和同在实验室的小伙伴说:“要是AI能帮我们阅读这些论就好了”,就这样,几个小伙伴花费了半年,做了关于论⽂的机器阅读理解的任务,研究出一个自动读论文的模型。

这个模型可以迅速阅读论文,获得出论文的主要观点、使用的主要研究方法,后来,她写一篇公众号文章的时间只需要一天,这个模型在同学中流传,成为大家速读论文的“利器”。那是她第一次感觉到,自己的创造能给身边人带来实际的便利。

生活中的她爱听音乐,会多种乐器,还组建过自己的乐队。闲暇时间,她最爱在街头巷尾发掘珍贵唱片,在她看来,在计算机科学领域的突破就像是在街角觅得自己喜欢的唱片一样让人欣喜。

拥有人工智能的思维,也让她有了对未来自己想从事的领域的其他想象。

“可能未来我可以戴上VR眼镜,看着那些历史上的乐团站在我面前,耳朵里传来的是自己想想就激动的经典曲目,科技让历史重现的一瞬多让人感动啊。”

洪逸宁曾经在和妈妈散步时,听到了妈妈眼中希望自己变成的样子——“从事金融领域,西装革履,妆容精致,经常打电话交际,踩着一双高跟鞋健步如飞。”

但她终究没有变成妈妈从前希望她变成的样子,她大学专业选了计算机时,明显看到妈妈的眼里有一点失落和心疼,“计算机多辛苦呀。”但她一口气读到博士,妈妈也理解了她的坚持和选择。只是偶尔会打趣她,“女儿啊,你怎么头发又少了。”但当洪逸宁谈起科技带来的美好生活时,妈妈还是会被她眼里的光打动。她会激动地告诉妈妈,“未来我们的机器人可能是我们最亲密的朋友,读懂人类的习惯和语言,慢慢培养出感情,我回家它就知道我今天想听什么歌、吃什么菜,希望能让孤独的人感受到,至少还有AI能懂得你。”

在她看来,现在的AI发展飞速,如在视觉领域,已经可以很好地识别出物体,并描述出来。但它们没有常识和记忆,不能进行推理、解释、交流。“我想研究的就是让这些机器除了原始感知外,还可以对这个3D物理世界常识推理。它们可以尽可能地去探索这个世界——和婴儿一样,构建出它们的内在模型。”

她喜欢的歌手Aurora曾经唱道“I would rather see this world through the eyes of a child, feel alive with a childlike。”那是她最喜欢的一句歌词,“我想像歌词里唱的一样,让AI从婴儿开始学习感知这个世界,而我也能像一个孩子一样去看这个世界,永远有好奇心和探索欲。”

百度是全球为数不多的、进行全栈布局的人工智能公司。从高端芯片昆仑,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有关键自研技术。在各领域的全栈布局也让百度构建了广阔而多元的开发者生态。

在百度,这样的女性是无数女性研发者的缩影,她们共同为技术的发展贡献着自己的热情和智慧,并拥有孩子一样的好奇心,为以男性居多的研发领域注入一股清澈的女性力量,用细腻和严谨为现实世界带来更多可能。

在1月10日举行的第五届百度 Create AI开发者大会中,李彦宏提到,百度将一如既往为社会、为产业培养AI人才。“三年前,我们宣布五年内为社会培养500万AI人才,目前已培养了超过300万。未来,百度会投入更多资源,与各位开发者们一道,为中国AI的发展尽我们最大的努力。随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年。”

【版权声明】本作品的著作权等知识产权归北京青年报【北青深一度】所有,未经授权,不得转载。

0 阅读:73

北青报深一度

简介:为认知变革中国提供纵深阅读文本