文科生揭秘古代数学自研AI瞄准加油站痛点大模型纠错标语翻译

南方都市报 2024-11-19 07:17:06

林锦耀

李宇耀广外信息科学与技术学院信息技术教学部系主任

韩轶超

郝鹃广外信息科学与技术学院软件工程系讲师

王晨旭

周栋广外信息科学与技术学院软件工程系教授

扫码看专题

日前,由广东省教育厅主办、广东外语外贸大学(以下简称“广外”)承办的2024年广东省大学生计算机设计大赛暨第17届中国大学生计算机设计大赛粤港澳大湾区赛(以下简称“大赛”)成功举办,来自粤港澳大湾区138所高校的5102件作品参赛,参赛师生增至近2.5万人,规模空前。其中,广外全校共有来自46个专业537人次参赛,18组作品获得国家级赛奖项,包括一等奖1项、二等奖9项、三等奖8项。

近日,南都记者走近三组获奖团队师生,倾听科创新生代的青春故事。

国际商务英语学院学生林锦耀

探索计算机起源广州赤岗塔作答

“一上一,一下五去四,一去九进一……”嘴里念着口诀、手指在算珠上飞舞,珠算课上的场景让人印象深刻。中国珠算被誉为“世界上最古老的计算机”,从结绳计数到四则运算,中国古人一直是探索计算技术的前进者。探索计算技术的起源,是广外学生林锦耀(团队)的作品《古数华典》内容背景之一。

林锦耀是广外国际商务英语学院管理学专业大三学生,今年组建一支全文科团队参赛,制作的作品获得了2024年中国大学生计算机设计大赛一等奖、2024年广东省大学生计算机设计大赛一等奖(数媒动漫与短片)。

全文科战队因古代数学结缘

去年12月,林锦耀收到一则通知:今年大赛,谁要参加?2024年4月11日要开始第一场比赛。组队、与指导老师沟通、确定选题……时间紧张,林锦耀想到自己所属的社团,有的擅长文案,有的擅长视频拍摄,有的擅长剪辑。今年1月,林锦耀把组员全部集齐,这是一支完全文科“战队”,5人都来自商英学院。

文科生如何解决理工题?林锦耀选择了数媒动漫与短片类别。“刚拿到题时其实心里是没底的。”得知竞赛题目是古代数学的时候,林锦耀说,他和团队直接跑去了李宇耀办公室。

李宇耀是广外信息科学与技术学院信息技术教学部系主任,研究教育/人文数据挖掘,大赛经验丰富。“当时觉得他们很有干劲,觉得可以试一试,就答应了下来,虽然他们属于文科类别,但数媒赛道更能展现文科同学的创意,也是很合适他们的方向。”

中国的算盘就是在古代最好的算力工具。经过长时间发展,才有了今天触手可及的大数据模型、人工神经网络等更强大的算力工具。经过李宇耀的指导和思路梳理,林锦耀(团队)专心将文案细节整理优化,最终确定了用圆周率、珠算和数列为代表,展现中国古代数学的成就。

“就像数列篇,我们介绍到广州的赤岗塔,他的建造使用到了数列的知识,这是古人智慧具体展现在当代人面前的事物,我们当时觉得这个也是很重要的展示场景。”林锦耀说道,借用身边可触碰的历史,让短片更生动和教育意义,中国古代数学并不仅仅是教材中冰冷的文字,他们鲜活地存在我们的生活里面。

发挥专业特色讲好中华故事

广州作为千年商都,外语外贸是城市的底色也是广外的特色。林锦耀和团队在制作视频时,也在思考如何把文科的知识结合在理工科的课题里面,“我们都是英语专业出身,思考能否把英语融合在作品中。”

翻译古代专有名词不是一件容易的事情,非常考验团队专业素养,翻译选择是意译还是音译,标点符号的应用都需要扎实的功底,林锦耀和团队都花费了大量的时间和精力,最终在省赛和国赛之前,制作了双语字幕。林锦耀和团队目标就是向世界讲好中国古代数学故事。

天气原因的干扰多次打乱拍摄计划,短片中赤岗塔的无人机航拍画面,对天气要求很高,整个6分多钟视频,虽然赤岗塔只出现了两三秒,但团队花费了三四个小时,拍下五六十条素材回去剪辑。赤岗塔作为广州曾经的标志性建筑之一,是视频对古代数学成就最好的“解答”之一,林锦耀和团队希望用他们的力量表现中华古代数学文化对古代乃至当世发展的巨大贡献。

林锦耀和团队从今年2月份开学起,开始商量用什么技术来展现主题。他们计划实景拍摄,又觉得很普通,他们尝试制作一些2D或者3D动画去替代。“有些软件之前的确没有接触过,可以说是从0开始学。”作为非专业的学生,团队一步一步查着教程、实践,一步一步解决出现的难题。

不拘泥于范式,创新是此次大赛的初衷。《古数华典》这部完全由文科学生创意制作,由工科老师指导的竞赛作品,通过介绍古代数学成就,林锦耀和团队用创新方式重现了中华古代数学文化,让世界重新了解人类在追求计算技术发展中,中华民族对古代乃至当世发展的巨大贡献。

寄语

李宇耀广外信息科学与技术学院信息技术教学部系主任

对学生:特别有想象力和执行力的优秀团队。中国古代数学有很多辉煌的成就,如何用当代方式表达,是非常需要想象力去展现的。

对作品:在整个设计语言和主题的关联度上,有很多独具匠心的设计。计算机和人工智能技术的飞速发展,降低了技术门槛,使得更多专业领域的创作者可以灵活驾驭。文科思维的人文关怀特质,被技术赋能后,创作出来的作品会有一种特别的穿透力。文科在这一块有特殊的优势,这是一片蓝海。

信息科学与技术学院学生韩轶超

从0开始调研学编程为解决加油站安全生产难题

登录平台打开摄像头,点击加油区模块出现:一个橙色框框住正在加油的汽车,另一个红框框住一处普通人肉眼难以识别的小火苗,实时发出警报……为解决广东乡镇加油站人工监控视频监管效率低下等问题,韩轶超组队自研AI系统《加油站安全作业智能监控管理平台》。“我们正在申请两个软件著作。”韩轶超是广外大三学生,他的参赛作品在10月10日公布的2024年(第17届)中国大学生计算机设计大赛结果中被评为二等奖,同时也是2024年广东省大学生计算机设计大赛(人工智能应用)一等奖作品。这位科创新生代从0开始多次调研,为企业量身定制低成本方案,历时一年自研AI算法,科技成果正转化为现实生产力。

“奔着落地去”瞄准乡镇加油站安全生产痛点

韩轶超就读于广外信息科学与技术学院计算机科学与技术专业,大一加入创新实验室。郝鹃与余扬是实验室的老师,也是该参赛作品的指导老师,她们早已定下目标:研发加油站安全作业智能监控管理平台。

去年11月,郝鹃带团队多次前往广东一家成品油销售公司和大学城某加油站进行实地调研。第一次调研,他们被一段历史事故视频触动到:原本火苗很小,小到在监控摄像头,普通人用肉眼难以捕捉,突然嘣一下,爆炸了。“用人工智能技术去做分析识别和实时预警,是不是就能避免了?”韩轶超心想。

一次次实地调研,他们发现广东加油站存在三个主要问题。首先是人工监控视频导致监管效率低下。被调研的成品油销售公司在广东的加油站有1100余座(包括合资油站),按每座加油站10个监控摄像头配置,十几个专职工作人员24小时实时着监控一万多个摄像头。再者,工作链条过长导致违规行为处理滞后。三是广东乡镇加油站工作人员数量不足、当地市民安全意识不高等问题更为突出。目前广东加油站总量近6000座,位于县乡道和农村地区的加油站比例为52%左右,乡镇加油站基数大、占比高。结合调研情况,方案做出设计:要面向广东乡镇加油站。

“我们是奔着落地去的。”韩轶超发现,加油站的电脑均没有配置GPU,而人工智能产品需要在导入各地加油站的电脑后,通过GPU等加速器实现功能,“如果方案设计前忽略了这点,加油站就需要新增配置,成本是巨大的、不实际的。”结合企业实际需求再分析,方案做出调整:这个系统必须要轻量级。

“没有先例”自学两种编程语言彻夜写代码做系统

瞄准广东乡镇加油站实际生产两个最痛点做系统,目前市面上基本没有成型的系统产品,“没有先例。”韩轶超说。从0开始,开发系统,敲定场景。开发系统,需要识别加油站违规行为。对于初次做人工智能系统的学生团队来说,短时间内,不可能做到全部识别。“那就一个个尝试。”团队与企业敲定先做6种违规行为。

从0开始,自研训练模型,收集数据集。韩轶超骑着自行车跑去附近加油站拷贝日常监控视频和图片,携两个硬盘“满载而归”。但图片仅有1000多张,训练出来的模型精准度非常低,数据集体量远远不够。“那就自己模拟场景拍图。”韩轶超与队友借来加油站工作服、戴上安全帽登上梯子,一人爬上教学楼二楼举着摄像机拍,另一人来回走动模拟打电话等场景。最终,数据集内有近60万张图,每张图均有标记。在运行系统时,韩轶超意识到,系统没法同时标注多种场景。团队现在掌握的技术,没法写出并行监测的代码。怎么办?从0开始,学编程语言,写程序代码。为实现以上功能,要自学两种编程语言,同时还要统筹作品进度做优化,韩轶超常常彻夜写代码做系统。他用自学Python语言,编写出了加油站智能监控子系统,可以读取摄像头的图像,实时动态分析加油站中人和物是否存在违规行为或安全隐患点。

5月25日是2024年广东省大学生计算机设计大赛决赛,作品获得(人工智能应用)一等奖。暑期期间,作品获得2024年(第17届)中国大学生计算机设计大赛二等奖。“我们正在申请两个软件著作。”韩轶超在10月17日接受南都记者采访时,一脸自豪地说。今年10月初,广东一家成品油销售公司愿意开放一个加油站的端口实测这个平台。“公司看上的是参加国赛时的新系统。我们会持续优化系统,希望更多师弟师妹加入,一起把系统做得更完美。让这个平台落地全国,走向全世界。”韩轶超满眼憧憬。

寄语

郝鹃广外信息科学与技术学院软件工程系讲师

对学生:这帮孩子心中有爱、眼里有光。用心用情日夜钻研,他们说科研是快乐的,这份纯粹的热爱,让我动容。希望有更多孩子也能坚持长期主义,扎根一个研究项目,静下心来,深入研究,体验心流的感觉,享受研究的快乐,获得真正的成长。

对作品:把论文写在祖国大地上,是这个作品最大的意义。把他们从课堂带到企业里、带到社会上,关心社会,关心国家,去发现社会上还有很多的问题值得去做,这样他们才会想到用科技服务社会,使我们的生活更美好。

信息科学与技术学院学生王晨旭

AI纠错城市标语翻译更快更全面

“马桶易堵”翻译成“ToiletisblocKed(马桶已堵)”……去年年末,王晨旭发现,广州不少公共设施标语充斥着此类翻译错误。“希望这个系统能对广州甚至全国的标语正确翻译和使用起到作用。”王晨旭是广外信息科学与技术学院大三学生,今年组队自研的《基于生成式人工智能的广州市标语翻译与纠错系统》,获得了2024年广东省大学生计算机设计大赛一等奖(软件应用与开发)与2024年中国大学生计算机设计大赛二等奖。

一个跨学科跨专业的五人团队,历时9个月自研AI系统,以人工智能应用等我省战略产业发展方向为研究方向,致力于为城市装上AI眼睛,提升城市美好形象,让城市治理现代化。

偶然发现公厕标语、地铁电梯标语翻译错误多

去年岁末,王晨旭闲逛流花湖公园,一个公厕标语英文翻译引起他的注意:“马桶易堵”翻译成“ToiletisblocKed(马桶已堵)”。

一字之差,意思差之千里。无独有偶,随后一次外出吃饭,王晨旭注意到,广州地铁二号线站内的手扶电梯标语:电梯(elevator)被译为“stair(楼梯)”。

“标语的指示功能被大大削弱了。”王晨旭上网搜索发现,翻译错误的标语在全国有很多,在二三线城市更为泛滥。例如“小心地滑”的标语,底下对应的英语却是slipcarefully(小心地滑倒)。虽然看起来是小问题,但频繁的出现,对城市的国际形象会产生负面影响,也会对有需要的人产生错误的指引。他开始琢磨:“该做一个怎样的软件解决这些问题?”

王晨旭发现市面上同类App能实现的功能还比较初级。他想要做的不只是一个能翻译的软件,还能收集翻译错误的标语及位置,反馈给相关负责的部门,推动后续的修改;再增加一个审核端口,让专业的人士、志愿者、相关部门对报错进行审核,鼓励用户更积极地去发现和反馈错误,形成一个激励循环。

这个想法得到了导师周栋的肯定。周栋是王晨旭所在的信息学院智能信息处理实验室导师,也是信息学院软件工程系教授。

一个App如何准确地识别出标语中的翻译错误,并对识别出的错误进行有效的纠正?周栋建议他直接使用大模型:在系统内搭建一个智能体,让它来完成具体的操作,可以大幅简化研发的过程,“既然模型能够进行纠错,那么我们可以将其应用在报错端口,也可以用在审核环节。”

跨界团队手工标注3000条标语自己研究算法

“我需要一支英语翻译、计算机技术都很强的团队。”王晨旭组建的团队共有五个人:一部分同学负责制作App、优化算法、设计界面、开发前端后端等;另一部分负责收集并整理包含大量广州公共标识及其规范英文译写的平行语料库,要对文化娱乐、旅游、交通、教育、医疗等十个公共服务领域的标语进行翻译和纠错。“团队里,有高级翻译、汉语专业的同学,他们手工标注了三千条左右的标语。”王晨旭介绍。

王晨旭负责的是算法研究。在查阅大量文献综述,了解一些主流方法和技术后,他发现公共场所的标语翻译这个分类太“小众”,没有现成的代码能实现这个功能。“我只能自己研究。”大二时,学校课程对大模型算法的涉及还比较少,王晨旭觉得“很晦涩,得生啃。”抱着电脑一头埋进实验室,用大量课余时间和周末节假日来学习。

团队找到高翻学院的学生,收集反馈需求,最终达成一致:以“翻译为主,纠错为辅”的方向推进,即在翻译模块中嵌入轻量化的纠错功能,通过预处理实现基本的语法与拼写检查,同时将重点放在优化多语言翻译的准确性与流畅性上,确保翻译结果贴合语境和文化背景。

“AI是势不可挡的。”一个跨学科跨专业的五人团队,历时9个月,基于AIGC打磨AI作品,王晨旭感慨道。最终,《基于生成式人工智能的广州市标语翻译与纠错系统》获得了2024年广东省大学生计算机设计大赛一等奖(软件应用与开发),2024年中国大学生计算机设计大赛二等奖。

除了希望项目能推广出去,对城市语言景观的治理出一份力,王晨旭表示将继续寻找更多算法,去解决现实生产生活中的问题。

寄语

周栋广外信息科学与技术学院软件工程系教授

对学生:非常有活力、有特色,是一个融合AI人才、语言人才等具有广外特色的跨学科团队。

对作品:兼具实用性和公益性。生活中,标语错误无处不在,但缺乏发现渠道和上报渠道,这个作品在目前市场上是稀少的。广外信息学院一直在做多种小语种的语料库,希望未来实验室的同学们可以把这些内容集成到大模型里面去,也希望这个系统能落地转化为成果,真正产生经济效益、社会效应。

总监制:戎明昌刘江涛

监制:王佳田霜月李阳

策划:陈实

统筹:欧阳云蔚李芷琪吴钰华任磊斌

采写:南都记者李芷琪杨景博潘欣

摄影:张志韬冯宙锋

设计:刘妍妍

0 阅读:0

南方都市报

简介:换一种方式,南都在现场。