人工智能生成的考试答案在现实世界的盲测中未被发现

研究人员发现，经验丰富的考试阅卷员可能很难发现人工智能（AI）生成的答案。

这项研究是在英国雷丁大学进行的，大学领导正在努力确定人工智能在研究、教学、学习和评估方面的潜在风险和机遇，并根据他们的发现向员工和学生发布了最新的建议。

研究人员呼吁全球教育部门以阅读和其他正在制定新政策和指导的人为榜样，并采取更多措施来解决这一新出现的问题。

在今天（6 月 26 日）发表在《公共科学图书馆·综合》杂志上的一篇对现实大学考试系统的严格盲测中，ChatGPT 生成了几个本科心理学模块的考试答案，在 94% 的情况下未被发现，平均而言，其成绩高于真实学生提交的答案。

这是迄今为止同类研究中规模最大、最稳健的盲法研究，旨在挑战人类教育工作者发现人工智能生成的内容。

在雷丁大学心理与临床语言科学学院领导这项研究的副教授彼得·斯卡菲和艾蒂安·罗施教授表示，他们的发现应该为全球教育工作者敲响“警钟”。最近，联合国教科文组织对450所学校和大学进行的一项调查发现，只有不到10%的学校有关于使用生成式人工智能的政策或指导。

斯卡菲博士说：“许多机构已经摒弃了传统的考试，以使评估更具包容性。我们的研究表明，了解人工智能将如何影响教育评估的完整性具有国际重要性。我们不一定完全回到手写考试，但全球教育部门将需要在人工智能面前发展。这证明了雷丁大学学术的严谨性和对研究诚信的承诺，我们用显微镜审视自己，从而在这方面处于领先地位。”

罗斯奇教授说：“作为一个行业，我们需要就如何期望学生使用人工智能并承认人工智能在他们工作中的角色达成一致。人工智能在生活的其他领域得到更广泛的应用，以防止社会信任危机，这一点也是如此。我们的研究强调了我们作为信息生产者和消费者的责任。我们需要加倍致力于学术和研究诚信。”

雷丁大学负责教育和学生体验的副校长伊丽莎白·麦克鲁姆教授说：“很明显，人工智能将在我们生活的许多方面产生变革性的影响，包括我们如何教育学生和评估他们的学习。在雷丁大学，我们开展了一项庞大的工作计划，考虑我们教学的各个方面，包括更多地利用技术来增强学生的体验，提高毕业生的就业技能。解决方案包括摒弃过时的评估理念，转向更符合学生在工作场所所需技能的评估理念，包括利用人工智能。与跨学科的同事分享能够使学生展示其知识和技能的替代方法至关重要。”

0 阅读：0