高考时间,莘莘学子在盛夏的考场里认真作答。
北京青年报“教育圆桌”联动“放牛班”,组织了一场打擂,邀请人类作者和5家人工智能同上考场,同题竞赛。
最终,往届高分考生以45分取得最高成绩,“元宝”以39.5分位居第二,“豆包”也获得了39分,“通义千问”和“文心一言”紧跟其后分别得到38和37.5分,“GhatGPT4o”和青年作家并列,同为32.5分。
下了擂台,我们组织了一场讨论,当AI能写高考作文,当人工智能全面内嵌到生活,我们该如何重新理解人文教育?在“历久弥新”的高考作文焦点里,我们如何“打开”新的思考空间。
【论坛嘉宾】
周晓枫:北京老舍文学院专业作家,北京作家协会副主席。曾获鲁迅文学奖等文学大奖。1988年高考作文满分,2023年北京高考语文试卷现代文阅读题目《黄桃酿》作者。
(60后)
未接受此次擂台挑战
郑重:青年作家。笔名烟波人长安。2008年参加山东高考,以642分考入北京语言大学。毕业后从事写作,出版多部小说作品,豆瓣等平台签约作家,现中国人民大学创造性写作研究生在读。(90后)
参赛者
贺国卿:人大附中经开学校校长助理,语文名师,28年高中语文教学经验。(70后)
阅卷者
孙萍:中国社科院大学新闻传播学院传播系主任 。(80后)
社科学者,
长期关注算法与社会议题
01 人机对战写高考作文,
擂台搭好了,你敢上吗?
北青报:得知北青报的这次“人机对战高考作文题”策划,您有什么想法?
郑重:我的第一反应是很好玩,很有趣,也有些激动,感觉这会比人和人之间的比拼更有意思。AI这两年的发展是非常迅速的,我觉得用这种方式完成一场人与技术的讨论是很有意义的。
孙萍:这个选题特别好,背后有值得探讨的维度:在人工智能时代,我们面临的不再是过去“教书育人”的法则,考试到底要考什么?教育到底要教什么?是否会迎来一些颠覆性的改变?作为社科学者,我们可以拿更大的样本做研究,也许会有其他收获。
周晓枫:这个选题是在探讨各种可能性。写作者在松弛状态或游戏精神下的创作,和高考学生在连续高压下的限时写作是不一样的,所以这不是好胜心的比拼,也不是技能下的炫耀,如果写得好可能包含着条件和心态的放松,如果写不好可以让考生们建立自信:所谓专业者也不过尔尔。
当然,AI没有这么多“内心戏”,不过是一个指令下的执行任务。无论人工写作还是智能写作,都是给学生们提供新思路,让社会对新现象有所思考。
至于我自己,没有准备好上场。说实话,我也准备不好。
贺国卿:前两年ChatGPT刚出来时,我曾参加过一场类似的AI写作高考作文的点评。当时最深的感受是,AI的创作还是套路化的,像答政治历史题一样,比较冷冰冰、硬邦邦,缺乏一种温度、一种温情,缺乏人的一种特殊的思想和情感,到了今天我也持相似观点。
北青报:郑重老师在55分钟内完成了比赛交卷,非常接近“高考时间”。我们也找过很多作家,都被以各种理由拒赛了,您为什么选择参赛?
郑重:我个人比较喜欢有趣的东西,所以几乎没犹豫。我知道AI有极大概率产出的内容又快又稳,但我想这种尝试能帮我更了解大数据生成文本的逻辑,而且也是对自己的一个挑战。
北青报:周晓枫老师作为当年高考作文满分选手,这次没有参战,是因为恐惧和AI打擂吗?
周晓枫:郑重老师或其他愿意参战的选手远比我有勇气和兴趣。不是所有的作家都敢应战,比如我。我的畏惧主要因为长期松散甚至懈怠的工作习惯,已经不能在短时间内爆发能量了。
无论是参加高考的孩子们出于应试的原因,还是参赛的作家出于探索的乐趣,他们都拥有写作的勇气;而我,已经部分丧失了这种力量。多年的职业训练,我见得越多,心思越重,但年少的胆气明显弱了。
对我个人而言,我没把AI视为创作的敌人,因为目前我最大的敌人是自己。我希望能更多挖掘自己的可能性,但遇到非常大的阻力,所以没什么余力应战AI。
北青报:贺老师之前曾为AI写作打分,昨天又作为“人机大战”的判卷老师,压力大吗?您的评判标准是什么?
贺国卿:没压力,我们都是用高考作文的标准(来评判),这是有严格标准的。无论是AI,还是现实中的人写的,我们始终用同一标准对待。在面对这几篇文章的时候,我在意的是文章有没有思路、逻辑、观点、思辨性、思想深度等。这里面有的文章明显没有跟时代和自我结合,缺少情怀。
在我看来,AI就是一个程序,冰冷的程序,缺乏灵动、温暖、温情,看不到人间烟火,像板着面孔在说教。不论题目要求的是什么,在程式化的输出下,都像是公式化、套路化严重的议论文,缺乏深刻立意。
北青报:高考以标准化分数给作文判分,合理性在哪里?
贺国卿:高考标准化阅卷的合理性来自于教育部考试中心颁布的统一标准,这基本是全国通用的。
比如对于作文的整体评价要求文风端正,文脉清晰,文气顺畅。要求思想积极向上,符合社会主义核心价值观;内容切合题意,符合试题的材料、情境与任务要求;观点明确、逻辑严密、结构严谨、论证充分,思考具有独立性;表达准确流畅,合理运用词语、句式、修辞等。
这样的评分细则可以在800字的底线内,基本考察出学生的思维缜密性、思辨性、说理性、语言能力、学科素养等,满足高考对于人才选拔的需求。
孙萍:我同意贺老师的观点,高考还是选拔性的考试,总得有一个标准,否则难以达到选拔的目的。但现在这套给高考作文判分的规则,可能是仁者见仁、智者见智的。
尤其是有了AI以后,是不是要做一定的区分,对于缜密的规则,AI的适应性比人强。我们在未来的作文评分中,还需要考察学生哪些维度的能力,值得思考。
02 人机对战战况:
机器算力升级,人类要输了吗?
北青报:在参赛选手的作文中,你们看到了什么?人与AI的不同在哪里?
贺国卿:这次的几篇文章都是盲选,但能感觉到有些是人写的作文。不过在我看来,都缺乏眼前一亮的感觉。我猜测可能有几方面原因,一是写作者成年已久,离开考场多年,没了压力驱动,往往是随心落笔。
但真正的考生们是带着高三冲刺的压力,带着充足的准备、范文、金句去争取拿高分的。如果用高考阅卷标准看,成年人的写作很难适应规则,不是应试作文。
另外,成年人的眼界与经历和考生也不一样,面对同样的话题,思考的方向也是不一样的,“文章合为时而著”。
郑重:从参赛选手的视角去对比人和AI在写作上的区别,我觉得人表达的是过往经历和当下心理状态的结果,充满随机性和独特性。
比如同一个主题,我今天写的和我明天写的可能完全不同,但AI在短时间内不会有特别大的变化,它的内核是不变的。
随机性,可能是人更有特点的一种能力。
周晓枫:我没看到这次对战的具体篇目,仅以我了解的内容而言,目前看到的AI文本还是有些“机器味”。但AI还在起步阶段,还在成长,不能因为一个婴儿说话少,就断定他以后不能成为语言专家。
我对AI没有强烈的敌意,它是辅助人类的重要生产工具。作为工具,我们不希望AI犯错;但另一方面,人类在表达中也是会犯错的,这种犯错甚至非常珍贵。人的写作里包含着有温度的情感,包括失控和失误,这反而是写作的魅力所在。
孙萍:我觉得现在的AI写作挺厉害的,素材储备足够,拟人化程度也挺高。AI通过不断迭代,创作力也在突破我们对它的偏见。但人类作者还是更有血有肉一些:分段、断句、气口都会更随性真实,能感受到情感。
虽然AI生成的文章没办法代表考生所写的内容,但当我们在对比考生写作与AI生成的内容时,会出现难以区分的情况。
考生在完成高考作文时,不像校外非考试场景当中那么自如、轻松,他们会紧张,会采取防御姿势,会生成一些更结构化的内容,非常清楚地把逻辑列出来——这个点上是很AI的。
北青报:人工智能和人类的学习有多少相似性,在人文领域是如何进行机器学习的?
孙萍:基于我长期对人工智能还有算法模型的学习,总体来讲算法模型的学习是非常二维的。不停地跟AI说红色的苹果,黄色的梨,紫色的茄子,圆的是苹果,长条的是茄子……在这个过程当中,AI学习到的所有东西都是扁平化的,是人类基于现实生活做的一个像素化、数据化的处理。
但人的学习模式是多维的,眼、耳、口、鼻、舌、身、意,人会吸取信息后再融合、组合,最终形成一个巧妙的认知体系,和我们所谓的二维认知体系非常不一样。人最重要的是活在现实生活当中,(因为)人的创造力来自多元的现实生活。
郑重:我相信文字和语言是有规律的,所以人文领域也必然是有规律的。比如我的专业侧重写小说或写故事,很早之前就有理论表明人类现有的小说或故事模板已穷尽,AI自然可以充分学习这些模板,生产出漂亮、稳定的内容。
对人来说,尤其是从创作角度上讲,我们现在更需要的是作者本人的独特性和情绪、情感的个性化表达,AI的表达更程式化,但对于个人来说,每一个想法都是独特的,都是跟别人不太一样的。
北青报:国产大模型在进行算力角逐,这种算力升级对人文教育意味着什么?
郑重:在人文教育领域,机器算力的升级可能会帮我们快速找到更适合大众的、更有效的方向。人类用几十年乃至上百年摸索、迭代的教育理念,可能AI在极短时间内就能完成一套测算,长期来看是很有益的。
贺国卿:我们要找到人文教育中的特殊性。语文学科兼具工具性与人文性,在输出方面,AI或许能辅助完成一部分工具性的内容,但人文的部分是替代不了的。所有情感、思维、鉴赏,这些柔软的东西,是人类精神底色的一部分。
在教学中,我们讲李白:“轻舟已过万重山”,你要通过读课文,通过不同的情感去理解。需要我们带领学生去读、去品、去悟,读懂诗人,读懂诗文背后的内涵,它是灵动的、有灵魂的。
我呼吁孩子们减少电子阅读,重读纸质书。翻阅纸质书可以勾勾画画,有充足的时间思考、想象、感受,这是塑造人文性的关键一环。如果孩子们未来的阅读变得仓促,课余时间用来看视频化内容,这会比AI的影响还大。
孙萍:我们要反思的是到底要教什么,不用教什么?当大量背诵的东西、重复记忆的东西不再是重点,我们的人文教育该怎么做?人文教育的目的是什么?
它不是为了完成一项任务。人文教育或写作是为了记录,为了共享,为了抒发情感,在这个过程中要培养学生的共情能力。
目的性极强的内容生产,未来会越来越多地被AI取代。
03 人机对战反思:
今天我们需要什么样的人文教育?
北青报:今天, AI可以出卷子、写卷子、判卷子,当AI深度嵌入语文教学,我们的人文教育需要调整吗?
孙萍:我们要重新去回归人的本性,比如好奇心和提问的能力、比如审美和批判性哲学,对于孩子来讲,这些变得更重要了。不同的人生经历和不同的人生品质,还有共情和感受性是AI没法替代的,机器没法理解一朵花对人产生的影响,没法理解它摇曳的样子对人的心理会产生怎样的冲击。
每个人的创作之下都有根,这是人的共同记忆和人的经历所促成的一些东西。但AI是无根的,不是基于一个纵深型的人类生命体系的扎根链条所形成的。
郑重:AI也许可以帮老师、学生更快速地去理解文本、提炼文本,减少讲授和学习的时间。但这仅仅只能覆盖应试层面,老师如何在讲授中加入个人的理解和理念,学生又如何通过学习和阅读去丰富自我、见识更广的世界,这是AI做不到的。这也是我们写作的意义,学语文的意义。
写作是为了表达自我,学语文是为了了解语言、文字和人类的历史,构筑想象力。从这个角度来看,我们的语文教育可能需要更侧重“人”的层面而不是“考试”层面。如何让学生意识到文字和语言的重要性,学会自我表达,将外部的观念和自我成长融为一体,这是更重要的。
贺国卿:作为中国人,语文这个学科每一个人都应该学好。我经常说一个人如果学不好语文,就像一条鱼在水里不会游。生活在母语环境中,每日的所见、所听、所讲都是语文,这就是大语文思维。
我们经常告诉学生,学习语文最好的方法就是读书,现在的新高考专治不读书的学生。今年北京高考的阅读材料1万多字,不读书,孩子连题都读不懂、读不完。人文教育的改变,其实已经开始了。
近年来,高考命题时常出现“引发你怎样的思考”“引发你怎样的联想”的表述。我们可以从人工智能的时代背景思考这样的转变:因为AI没有生活体验、没有独特的情境,没有成长的故事,所以在故事性、情感方面是缺失的。AI可以有聪明的脑,但是人类拥有温暖的心。这是AI的短板,也是我们可以启发学生关注的。
我们能观察到,北京高考的题目正在往 “温暖的心”这个方面转变。比如,去年北京的高考作文叫《亮相》,希望结合学生成长过程中有什么精彩的亮相;还有一年的题目,让学生结合一个故事,写出这个故事给你怎样的力量。这些题目是我们高考命题的方向,也是一种文化育人,以文育人价值观的引领。
北青报:《劝学》说“不学习,无以广才”,当AI更像人,人应该怎样训练自己?
周晓枫:对我来讲,如果AI是我比不过的未来,我更要珍惜现在的创作,既然留给我的时间不多了,我必须更努力,不论这是我最后的辉煌还是最后的挣扎。
我不躲避AI的帮助,因为它可以更高效地处理资讯、获取知识,帮我减省了很多不必要的消耗。但写作,是我内心的表达需要,是我寻求与他人交流的方式,不能替代我自己心里的那几行字。即使为这几行字,我可能会想上一整天,但那出自我的内心。
郑重:与其说训练自己,倒不如说人应该更关注自己,关注世界的变化、观念的变化,关注情绪和情感的流动,关于生命的随机性和不确定性。AI终归是逻辑先行的,但人还拥有感性认识和艺术审美。
我们现在面临的AI和人的关系,很像两百年前尼采、康德等等哲学家所面临的思想困境——理性是有局限的,逻辑和理智并不能解决所有问题。如果说AI代表逻辑和理智,那人就是AI所触及不到的部分,我们也不需要去和AI比拼逻辑,我们只需要保留我们作为人的独特之处。
孙萍:我不属于一线的中小学和高中的教育体系。但我们现在对大学阶段学生有一点要求,所有AI给的文献全都要重新校准。我们发现,AI吸收的数据库,很多都是免费的,但真正有学术价值的如知网上的论文是付费内容,AI鲜少触达。所以用AI整理出来的内容对大学阶段的学生已不适用。
我自己感觉中小学教育并不适合跟大家说,以后都不用背唐诗了,不用学英语了,我们有了AI就有了一切。相比之下,单纯讨论AI对孩子们教育带来挑战,不如思考我们今天如何重新系统性地理解人类,理解这个世界的机理到底是什么?怎样通过教育人让社会变得更好?
如果只是追求“人类的教育要比AI更优秀”,那还是一套优绩主义的人文教育——陷入“我如何打败AI或者我如何打败其他人”的逻辑里。
撰文 | 北京青年报记者 张知依
整理丨邓培钧(特约)实习生 任玉函 涂盛青
统筹 | 林艳 张彬
图片 | 网络截图