新闻动态
NEWS
当司法遇上大数据 国双助力“法信”平台建设 实现法律数据智能化
近日,由最高人民法院批准立项建设的“法信”平台在江苏省高级人民法院进行了部署,这是“法信”平台上线以来在地方高级人民法院的第一次落地。“法信——中国法律应用数字网络服务平台”由人民法院出版社承建,平台中融合的裁判剖析大数据引擎(LD)和同案智推大数据引擎(SP)均由国双研发。“法信”平台的建成,已经让法律数据智能化走出了司法科技的实验室,是推进“智慧法院”建设的重要举措。
“法信”平台是什么
“法信”平台是通过目前国内规模最大的法律知识分类导航体系——法信大纲和国双提供的司法裁判剖析大数据引擎和同案智推大数据引擎,对海量法律条文、案例要旨、法律观点、裁判文书进行深度加工聚合、智能剖析推送,进而为法律人提供一站式专业知识解决方案,为社会推送法律规范和裁判规则的全国首家融合“法律知识服务”与“案例大数据服务”的法律数字平台。
国双首席执行官祁国晟(右一)在“法信”平台上线仪式上与最高人民法院院长周强等领导合影
“法信”平台于2016年3月31日正式上线。最高人民法院院长周强出席上线活动并讲话指出,“法信”平台的上线具有标志性意义,它是最高人民法院在“互联网+”和“大数据”时代推进人民法院信息化3.0版和智慧法院建设,促进法治中国建设的重要举措,是推动审判工作向智能化、现代化转变的有力抓手,将极大地影响和改变法官办案、学习方式,进一步提高审判工作质量和效率,为“司法为民、公正司法”提供有力服务和保障。
国双为“法信”平台提供的大数据技术
“法信”平台LD引擎的功能,就是在充分阅读理解裁判文书并自我学习进化的基础上,对裁判文书特定段落进行无限维度、多条件的自由组合和层层剖析;SP引擎则是利用大数据的聚类分析和智能排序功能,帮助法律人借助专业术语和要素在办理同类案件时同步实现法律事实的比对、法律关系的匹配、法律依据的校核和裁判结果的参照。
LD引擎除支持法院层级、审理程序、案件类型等基本维度外,还创造性地设定了很多特色的维度和指标,总计有一百多个,并可以进行任意维度、任意指标的自由剖析和下钻,界面友好,使用便捷。
SP引擎首度创造性地将自然语言处理、机器学习等人工智能方法应用于裁判同案匹配领域,加速匹配同案,一键智能推送。对于法律人,可以输入整篇格式化裁判文书找同案或输入“法”言“法”语专业表述法律关系找同案。对于普通老百姓,可以输入自然口语表述事实案情找同案。
特别是SP引擎中支持的口语化输入的技术,是国双所独有的。用户输入一段描述性的文字,引擎即通过NLP自然语言处理,在由全量文书构建的数据仓库中进行相关性的比对,从而调出相关性最高的文书,这一过程仅需400毫秒左右(1秒为1000毫秒),整个过程响应迅速,匹配精准。
国双司法(大数据)事业部高级总监王锰指出,“以分布式运算、自然语义判读作为技术的经纬,高效地拆解并分析结构化与非结构化的部分,并与司法领域、审判业务无缝结合是国双的优势。”国双的司法大数据解决方案区别于以往大数据在其他行业普适性的应用,是大数据首次进入一个专业垂直领域进行深耕,数据与专业业务深度结合所产生的爆发力将逐步显现。
国双司法大数据解决方案能被“法信”平台所采用,除了国双作为一家技术驱动型公司长期以来在大数据领域积累的技术和经验优势外,还得益于:国双分别与中国人民大学、哈尔滨工业大学建立的大数据联合实验室提供了强大的大数据技术支撑;国双汇聚了大量来源于法院、检察院和律师事务所的整个司法体系的一线从业人员,他们为解决方案的专业性和易用性提供了保障。
司法科技的践行者
国务院于2015年颁布《促进大数据发展行动纲要》,标志着我国大数据战略部署和顶层设计正式确立。“纲要”提出:将大数据作为提升政府治理能力的重要手段,通过高效采集、有效整合、深化应用政府数据和社会数据,提升政府决策和风险防范水平,提高社会治理的精准性和有效性。
《光明日报》一篇题为《以大数据促进国家治理现代化》的文章写道:把政府数据开放和市场基于数据的创新结合起来。政府拥有80%的数据资源,如果不开放,大数据战略就会成为无源之水,市场主体如果不积极利用数据资源进行商业创新,数据开放的价值就无从释放。
最高人民法院走在了政府数据公开的前列,2013年7月,《最高人民法院裁判文书上网公布暂行办法》正式实施。依据该办法,除法律规定的特殊情形外,最高人民法院发生法律效力的判决书、裁定书、决定书一般均应在互联网公布。对于社会关注度高的案件,生效裁判文书应当在互联网公布。
2014年1月1日,《最高人民法院关于人民法院在互联网公布裁判文书的规定》正式实施。最高人民法院在互联网设立中国裁判文书网,统一公布各级人民法院的生效裁判文书。
正是最高人民法院积极推动公开裁判文书以及中国裁判文书网的建立,为拥有成熟数据仓库和自然语言处理等技术的国双提供了进行数据挖掘与分析的数据基础。“法信”平台的建成,也成为了积极落实国家大数据战略的一个标杆。
下一个阶段,国双将利用大数据分析和挖掘、自然语言处理、人工智能等技术,结合司法领域的专业知识,构建面向司法专业领域的数据分析方法和系统,进一步建构司法语义数据仓库。通过分析法律法规、司法流程、司法解释、参考文献、典型案例、裁判文书、审判业务信息系统等数据,构建司法领域的主要实体、关联关系、主要属性等反映司法工作内在规律的数据结构。通过多种数据处理的技术,可以将上述数据源中提取的大量实际数据填充到这个数据结构中。例如,可以从裁判文书中提取大量的案件基本数据,以及案件之间的关联关系,当事人之间的关联关系,从而构建反映司法数据内在语义的数据仓库。
从上述数据源中,还可以进一步细分,构建案件所涉及到的各个生产生活领域的个别结构化数据,例如劳动争议、知识产权、商业信贷、交通事故等,构建这些领域司法数据的语义数据仓库,并与这些领域自己的专业数据连接到一起,产生更有意义的司法洞察。
国双与人民法院出版社合作建设的“法信”平台,已经让法律数据智能化,走出了司法科技的实验室;国双司法解决方案的终极目标是在法律数据智能化基础上实现司法人工智能。