大语言模型服务司法场景的展望和挑战
刘奕群
清华大学科研院院长、互联网司法研究院院长
过去几十年来,人工智能技术的发展经历了“三起三落”的过程。从早期的专家系统到现在的大模型,社会对人工智能的期望不断变化。当人工智能技术在某些节点上取得突破,比如AlphaGo和ChatGPT,社会的期望迅速飙升,甚至超出技术供给能力,造成失望和低谷。因此,在司法领域应用大模型时,我们需要建立合理的预期,既不能高估它的能力,也不能低估它的潜力。
司法领域具备应用人工智能的天然优势。2018年左右,我们在最高法的领导下,开始探索如何将人工智能应用于司法。司法领域有丰富的公开数据,这为大模型的训练提供了良好的基础。同时,司法机关迫切需要提高效率,人工智能的应用可以帮助他们提质增效。我们认为大模型在司法的全流程中都有广泛的应用场景,包括诉前调解、立案、审理、文书撰写等各个环节。
但我们发现,单靠通用大模型并不能解决司法领域的所有问题。法官在审判中不仅是法律专家,还要承担社会责任,维护公平正义。因此,司法大模型必须结合通用大模型的常识推理能力与法律领域的专业知识。通用大模型可以解决常识性问题,如要素提取和信息抽取,而司法大模型则可以提供专业的法律判断。
在我们做的研究中,通用大模型在处理某些复杂法律问题时表现不佳。例如,OpenAI的模型在区分受贿罪和贪污罪、寻衅滋事和聚众斗殴罪时,无法做到精准。因此,我们需要通过法律专业的数据对大模型进行微调,使其具备更强的法律能力。
为了构建司法大模型,我们通过注入法律法规、司法文书、教材和专家论文等数据,训练出法律基础模型。然后,我们使用少量标注数据对其进行后续训练,使模型能够处理特定的司法任务。这种方法与传统的监督学习不同,大部分过程是无监督的,标注数据的需求很少,但效果显著。
接下来,我想和大家分享一些具体的应用场景。首先,我们利用大模型为调解工作赋能。在案多人少的矛盾下,调解是解决社会矛盾的重要手段。通过大模型,我们可以将案件引导至合适的调解员,并为他们提供法律条文和问题建议,提高调解效率。如果调解不成功,我们还可以将调解记录结构化,供法官在后续审理时参考。
其次,最高法要求对案件进行阅核,尤其是院庭长的阅核工作。阅核不仅涉及文书的准确性,还要考虑案件的社会影响。大模型可以通过自然语言处理和舆情分析,帮助院庭长集中精力处理最具风险的案件,从而提高阅核效率。
另一个应用场景是法律咨询与对话系统。大模型在对话方面非常擅长,通过与一些法院的合作,我们开发了一个法律咨询模型,整合了地方法律法规,提升地方营商环境。在对话过程中,大模型不仅要记住重要的法律事实,还要能够回答用户的问题。
我们还通过大模型对一审案件的改判和发回进行预警。通过对潜在问题的提示,帮助法官避免错误判决,从而降低改判和发回率。
司法领域是一个多方参与的过程,庭审中涉及法官、辩护人、公诉人、当事人等多方角色。我们正在研究如何通过多智能体交互模拟司法庭审甚至立法过程,用计算手段帮助解决司法中的复杂问题。通过多次模拟庭审,我们可以提前预测立法可能带来的后果,为法学研究提供新的工具。
最后,我们与法信网合作,将其大量高质量的法律信息注入司法大模型中。这些高质量数据在大模型运行中至关重要,有助于法官和司法人员更好地办案。
清华大学互联网司法研究院成立于2021年底,是多学科交叉的研究机构,得到了最高法、最高检、司法部等部门的支持。我们希望通过与更多法院和企业的合作,共同推动司法大模型和司法人工智能的发展。
来源:海丝中央法务区
责编:黄慧儿
审核:方琮 高奇
■即将开幕!他们献上寄语
■海丝扬帆 法治护航
■厦门:解锁海丝中央法务区建设密码