织梦CMS - 轻松建站从此开始!

欧博ABG-会员登录-网站

法律文书数据集的收集、构建、清洗

时间:2025-01-16 04:22来源: 作者:admin 点击: 10 次
文章浏览阅读1k次,点赞16次,收藏31次。对模型表现的期望我们期望LecumentGEN中文法律文书生成大模型能给出符合现行法律条文的、具有规范格式的法律判决文书,并且拥有清晰的自我认知,能够认识到自己是人工智能而非律师法官等职业。_法律文书数据集

简介:与 GLUE 和 SuperGLUE ( Wang et al.,欧博abg 2109) 一样,欧博官网我们的目标之一是推动能够处理多个 NLP 任务的通用(或基础)模型,欧博在我们的例子中是合法的 NLP 任务,欧博娱乐可能具有有限的特定任务微调。这些数据的用途有两方面:(1)汇总体现不同数据过滤规范和法律的标准的法律的和行政数据源;这个语料库(37GB)的大小很大,代表了所有联邦和州法院的3,446,187个法律判决,并且比最初用于训练BERT的BookCorpus/Wikipedia语料库(15GB)的大小还要大。

(责任编辑:)
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:
发布者资料
查看详细资料 发送留言 加为好友 用户等级: 注册时间:2025-02-05 22:02 最后登录:2025-02-05 22:02
栏目列表
推荐内容