前言
笔者团队完成了千亿大模型的本地化部署,年前已对公开的有效数据进行爬取,并对部署的本地化模型进行法律专业化的训练与微调,以期能够得到兼顾数据安全与律师效率的自用模型。目前在合同审核领域,团队运用既有审核合同模板对模型进行训练、学习,已可以完成合同初步的审核、校对工作;在裁判规则整合方面,通过对不同案由、管辖法院、主办法官的裁判文书进行分级分类训练、学习,已可以为团队律师完成大量基础工作,AI助手之称已经名副其实。本团队致力发展律师业务与AI模型共同进步,也欢迎同行互相切磋、共同探讨,探索与丰富AI对律师工作的赋能方式。
DeepSeek横空出世,为AI领域注入全新活力。此前,笔者团队在《法律人的工具:史上最全20款AI法律领域测评系列(一)民商篇》以及《法律AI模型测评系列(二):合同拟定与审查》凭借专业视角与严谨测评,深度剖析了众多AI在法律领域的应用表现,为广大法律从业者和AI爱好者提供了极具价值的参考。延续前两期的专业洞察与探索精神,本次,我们将聚焦于新登场的DeepSeek以及Qwen、豆包、Kimi、腾讯元宝这几款具备一定影响力的AI,针对它们在民商和合同这两个关键法律领域展开全面且细致的测试,旨在通过严谨的测评,清晰地展现出不同AI在专业法律场景下的真实能力,为法律从业者、相关企业以及关注法律科技发展的人士,提供极具价值的参考依据,帮助大家更好地理解和运用AI技术,推动法律行业与科技的深度融合。
一、测试对象与方法
本次测试在前两次测试的基础上,精选了可自由使用的5款模型作为测试对象:
本次测试将从法律从业者的角度出发,主要从合同拟定与审查及民商两个维度对受试AI进行专项性评价,并结合“使用体验”进行综合性评价,具体标准如下:
二、测试结果
本次测试中,“合同拟定”部分选择了以技术服务合同为考核背景,考验模型的专业表达能力、风险识别能力与法律适用能力、逻辑性,“合同审查”部分通过设计一个在交易模式上存在风险、基本条款缺失、条款存在基本错误、用语不当的“背靠背”数据授权合同,考验模型对交易模式、结构、条款、文字符号的审查能力;同时,继续选择了3个民商领域项下问题进行提问,问题类型分别为简短的程序性问题、涉及时效与溯及力的中长案例以及一个长案例,最后结合“使用体验”进行综合测评,以争取获得一个全面的测试结果,具体问题与获得各AI的回答如下:
合同审查:
(合同原文内容)
测评结果:
DeepSeek
Kimi
Qwen
豆包
腾讯元宝
合同拟定:
DeepSeek
Kimi
Qwen
豆包
腾讯元宝
问题一
通过减资返还投资款的程序
DeepSeek
Kimi
Qwen
豆包
腾讯元宝
问题二
2020年1月5日,A公司与B公司订立采购协议,约定A公司向B公司提供技术服务。然而,在A公司提供技术服务后,B公司未能且无力支付服务费用。为此,2024年7月1日,A公司提起诉讼要求。B公司偿还服务费用。已知B公司有甲、乙两位股东未届出资期限未实缴股东,还有丙、丁两位前股东未届出资期限未实缴出资即转让股权。
问题:B公司能否在诉讼中追加甲、乙、丙、丁作为被告?若能,能要求他们承担何种责任?若不能,能否在执行程序中追加甲、乙、丙、丁为被执行人?适用的法律依据分别是什么?
DeepSeek
Kimi
Qwen
豆包
腾讯元宝
问题三
艺风有限责任公司(以下简称艺风公司)成立于2014年,由张某和赵某出资设立,注册资本100万元。为引进资本,赵某和张某找到了华云投资。华云投资系有限合伙企业,杨某为合伙事务执行人。2015年5月,赵某、张某、艺风公司与华云投资、杨某签订了《投资协议》,约定:1.华云投资为艺风公司注资2000万元,占股20%。股款分两次缴纳,第一期1000万元在2016年6月1日缴纳,第二期1000万元在2016年12月31日缴纳;2.赵某和张某应当在2016年12月之前缴清出资;3.任何一方不按期缴纳出资的,守约方有权解除《投资协议》。
2016年6月,华云投资按期缴纳了第一次投资款,将1000万元打入了艺风公司的账户,艺风公司变更了股东名册,办理了工商登记变更。华云投资委派刘某、王某担任艺风公司的董事,与张某共同组成董事会,赵某继续担任监事。
在一次招投标中,刘某利用董事职权,致使刘某的同学中标而艺风公司未能中标。为此,刘某与张某之间爆发了激烈冲突。张某要求罢免刘某董事资格,刘某表示公司发放董事报酬后就辞职。张某表示公司章程中规定董事没有报酬。
艺风公司要求华云投资撤销对刘某、王某的委派,华云投资只同意撤销对刘某的委派,不同意撤销对王某的委派。同时,华云投资未能按期缴纳第二笔投资款。经过艺风公司多次催缴,华云投资以资金不足、赵某和张某也未履行出资义务为由拒绝缴纳第二笔投资款。
张某于2017年2月提议召开股东会,艺风公司在2017年7月22日召开股东会,针对三个事项进行决议:1.罢免刘某的董事资格;2.罢免王某的董事资格;3.解除《投资协议》。
三项决议均符合公司法及公司章程规定的决议通过比例,但华云投资的代表只同意第一项,不同意第二、三项且拒绝签字盖章。
2017年8月,赵某和张某找到了新的投资人兆尚投资,便以艺风公司名义向华云投资递送了解除《投资协议》的通知函,将1000万元退还至华云投资账户,并于工商登记机关办理了华云投资的股东注销登记和艺风公司的股东变更登记。华云投资拒绝签收通知函,但也并未返还1000万元。
请问,艺风公司是否可以向企业登记机关申请注销华云投资的股权和股东登记?为什么?其向华云投资返还1000万元的行为是否合法?为什么?
DeepSeek
Kimi
Qwen
豆包
腾讯元宝
本次测评严格按照小项描述进行打分,得到了下列评分结果,具体分析将在下文展开。
三、合同审查
各AI模型的合同审查能力排行如下:
各AI模型的合同审查均为未修订前的合同提出了建议和意见,其中,五个模型均可以对合同不规范的表述提出修改建议,且均指出第三方付款模式存在的法律风险,一定程度上能够帮助到合同的修正。遗憾的是,五个模型均未识别出条款背后隐含的合规风险,因此,律师可以尝试使用AI模型完成初步的合同审核、校对工作,具体风险的识别与合规仍需进一步把关。
四、合同拟定
各AI模型的合同拟定能力排名如下:
首先,我们将对各AI生成的合同的“合规性”进行分析。AI模型在拟定合同的合规性上总体情况良好。AI模型对模板的适用较为熟练,但普遍存在不注明适用法律的问题,侧面说明AI模型跳过法律直接套用模板的可能。本次测试中,所有模型拟定的合同在交易程序上均不存在违规的情况。结合具体文本内容来看,这和AI模型熟练掌握合同模板有关。在“法律适用”方面,所有模型均未注明适用的相关法律或引用过于宽泛,即使在指令中存在明确要求。所有受试模型在“结构严谨”性上均为满分,除了借鉴模板的原因外,也与本次测评的提示词已经编排好了相关结构有关。所有模型的合同可操作性较好,这主要是因为各模型的表述大致相同,变化较小。由此可见,AI模型可以协助律师完成合同初步拟定的工作。
五、民商事领域问答
评价标准:我们将对各AI的“检索能力”“分析能力”“输出结果”进行解析赋分,本部分得分如下:
分析如下:本次测试中,除“Kimi”“豆包”之外,“Qwen”“DeepSeek”“腾讯元宝”引用了旧《公司法》,这反映了大部分模型都存在数据滞后的问题。在法律领域,AI模型无法及时更新数据库,将导致法条定位根本错误。
尽管部分模型检索到了新《公司法》进行引用,但五个模型均未检索出最高人民法院于2024年12月24日发布的《关于<中华人民共和国公司法>第八十八条第一款不溯及适用的批复》(法释〔2024〕15号),仍增加了法律工作者甄别其效力与二次检索的负担,不能有力地帮助法律人解决问题。在分析能力与输出结果上,因未能对制定法与司法解释的更新进行跟踪、理解最新的裁判精神,以及对长问题中法律关系识别与分析能力的缺乏,各模型均得出了错误的结论,即使部分的结论接近答案,其分析过程与该法律问题现有的分析逻辑也并不相同,但也提醒法律人,在使用的过程中需要更为谨慎,不可尽信AI模型对适用规范的检索与结论。
六、使用体验
评价标准:围绕使用体验(简洁程度、功能关联、处理速度、可区分性)对5个模型进行测评后可以得到如下结果:
各AI在简洁、便捷程度与可区分性上均有不错的表现。在处理速度上,所有模型均能在10s内输出结果,使用体验较好。就算模型界面具有多项功能,其功能转换方式也清晰明了。
七、总结
总体来说,当前市面上的模型依据庞大的数据库在合同拟定方面较为成熟,但是由于当前模型对合同的分析能力还多停留在文本的逐字理解上,缺少结合上下文、实践经验和法律数据库综合分析的能力。
Qwen在本次测评中也展现了其不俗的实力,相较而言,根据评分可以看见,最近热度极高的DeepSeek的使用感受并没有达到令人惊艳的程度,但我们仍可以对DeepSeek在将来的表现抱有一定的期待。
最后,结合上两次测评,本次测试中AI模型更多地表现出了一种通过概率计算而产生的机械的思考模式,启示着在这个时代,我们要在机器智能洪流中保持认知主权,在算法丛林中培育人文精神。这需要我们有批判性思维来对抗大量的深度伪造,需要我们去观察,去思考,去验证各种观点,而非动不动就“遥遥领先”。
在法律与AI深度融合的时代,法律从业者、企业等相关方在选择AI工具时,应充分结合自身实际需求、预算以及使用场景。同时,我们也要清醒地认识到,尽管AI技术发展迅速,但目前还无法完全替代法律专业人士的判断和决策。法律人应不断提升自身专业素养,合理借助AI工具的优势,提高工作效率和质量。
“本次测试提问的内容与主体信息均为虚构,仅为团队编写用于测评使用,不涉及任何真实的合同与交易行为”
特别声明:
大成律师事务所严格遵守对客户的信息保护义务,本篇所涉客户项目内容均取自公开信息或取得客户同意。全文内容、观点仅供参考,不代表大成律师事务所任何立场,亦不应当被视为出具任何形式的法律意见或建议。如需转载或引用该文章的任何内容,请私信沟通授权事宜,并于转载时在文章开头处注明来源。未经授权,不得转载或使用该等文章中的任何内容。
1. 卢健等:《最高人民法院关于大型企业与中小企业约定以第三方支付款项为付款前提条款效力问题的批复》专题解读与实践建议
2.卢健等:“低空经济+物流”如何布局?——从法律视角展开(上)
3.卢健等:“低空经济+物流”如何布局?——从法律视角展开(下)
4.卢健等:无人机适航管理法律指南——以低空物流为视角
本文作者
感谢实习生郭佳林、黄毅杨、董新雨对本文作出的贡献
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.