【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

实现司法人工智能的国双道路

  • 2019-10-10
  • 本文字数:6114 字

    阅读完需:约 20 分钟

实现司法人工智能的国双道路

2017 年 12 月 29 日,北京大学法律人工智能实验室和北京大学法律人工智能研究中心成立仪式暨第一届北京大学法律与人工智能论坛在北京大学法学院凯原楼成功召开。最高人民检察院、最高人民法院、中国法学会、中国网信办、公安部和全国相关地方人大常委会、法院、检察院的领导及同志出席了会议,北京大学、清华大学的专家学者以及为司法信息化做出贡献的技术公司,包括国双,参与了论坛。论坛中,国双代表分享了国双大数据及人工智能技术应用在司法垂直领域的探索,如何实现智慧司法的技术路径与需求难点。


国双助理总裁石鹏先生作为论坛中产业界的代表,在 “法律人工智能的当下与未来”单元中,发表了题为《在“积极稳健”、“专业科学”的建设原则下探索智慧司法》的主题演讲。他总结了通过 2 年来的实践,认为司法领域的建设和探索可能存在的问题,并提出了建设的方向性意见。他认为,在司法人工智能这个命题下很多东西还待思索、待论证、待实施、待创造。我们在迎接未来,因此需要专业领域的交叉人才、高层人才;需要脚踏实地的建设者和高屋建瓴的构架者;需要对未来的畅想和对现阶段的清醒认识。我们有很好的时代,有很好的基础,但现在仍然是数据建设的初级阶段、人工智能建设的萌芽阶段。未来已来,我们身在其中,为之努力。


国双司法大数据事业部总经理王锰在论坛的“法律人工智能技术的发展”单元中,通过智慧法制建设、司法人工智能是实现智慧法治的路径、国双的核心能力、解决方案以及发展方向等五个部分分享了国双对司法大数据的理解以及在应用上的经验。国双认为,司法人工智能,是一整套解决方案,用以模拟和扩展人在司法实践中的工作方法和决策过程。解决方案本质是利用大数据驱动办公自动化,利用大数据支撑决策智能化。


国双司法大数据事业部咨询总监李斌作为本单元评论人,总结了目前法律人工智能的不足,首先是人工智能所仰赖的数据养料,在法律行业尚嫌不足;第二是法律 AI 从业人员的不足。希望实验室作为一个法律人工智能的孵化器、宣传窗,提升整个法律从业群体对法律人工智能的参与。

以下是演讲实录

《在“积极稳健”、“ 专业科学”的建设原则下探索智慧司法》——国双助理总裁石鹏

各位来宾大家上午好!非常高兴回到母校参加今天的盛典。刚才各位嘉宾和领导都做了非常精彩的发言,尤其是听到黄老师(北大信息科学技术学院计算科学技术系主任,教授黄铁军)讲到人工智能算法时,从产业界来讲我们非常兴奋,可以感觉到大家在很多方向上的认知是趋同的。



去年,在北大国双庭院演讲时,我说的还是探索司法和大数据的结合;短短一年多,我再次代表国双来北大演讲,就有这么多合作伙伴聚在一起,共谈司法人工智能的方向。可见,科技带来的理念转变是多么迅速。我们都看到了未来的发展方向。


无疑,我们正处在司法人工智能的热潮中。


今天早上,我做了一次搜索,发现自七月份以来,与法律相关的人工智能全国性论坛开了 26 场,重要会议在 30 次左右。这一方面说明法律界都高度重视新技术与司法的结合,一方面也告诉我们要在热潮中保持冷静,看看我们在科学、理性的建设中到底处在什么位置,有没有因为一些过于美好的描绘而忽视了现阶段需要解决的基础性问题。


通过 2 年多来的实践,我认为司法领域的建设和探索可能存在以下几个问题。


首先 ,从顶层规划来说,对规划制定投入很多的人力物力、但是随着技术的进步和理念的深化,规划成为一个静止的条条框框,规划在实际执行中的调整完全被忽视;从项目上来说,客户比较重视短平快的产品应用、不愿意过多的在大数据平台架构上投入;从技术上来说,业内关注点集中在个别产品的实现结果,轻视实施方法的科学性、先进性和可复制性;从建设资源的投入来说,重短期可见效投入、轻长期布局性的投入;从建设方式来说,各种样板试点很多,但总结经验,凝练路径,复制扩展并不多见。


基于此,我提出以下建设的方向性建议,抛砖引玉,供大家思考。


第一、重视建设的规划。我有幸参与过一些顶层规划的方案设计工作,但是,科技的进步和环境的改变,使得规划很难跟上调整的需要,这个跟法律修订的相对滞后是一个道理,那么应当采取什么方法应对,如果规划不调整变化,执行可能出现问题。两年前,大数据的概念,在司法的领域内,蓬勃而起,今天,人工智能、物联网方兴未艾,我们的规划是否理顺了传统信息化、数据化建设、人工智能、物联网,这两两之间的相互关系,建设递进关系是什么,建设规划如何衔接、建设基础如何接轨。我们今天建设所遇到的各种问题,在我们迈向政务物联网时代的时候,不应该依然困扰我们。我认为,我们今天谈论、研究、思考的规划,不仅是一个政务体系的建设规划,也不仅是一个科学的发展规划,而是一个以各种门类科学、技术、研究为基石的,影响力及于整个政法、司法、法学生态的,并受到各种社会因素变量调节的庞大思想体系和方法论体系。


第二、建立一个前瞻性的、开放的通用全数据平台,作为司法及各种法律数据汇集的中心,统一规则、高效采集、处理司法源数据。在眼前的建设中,我们面对太多的不统一、面临太多的应用需要实践考评、需要处理太多的历史数据孤岛,不解决这些问题、不将解决问题的方法搞明白,我们实现不了集中、实现不了同案同判。继续延用现在这种应用和应用之间数据对接的模式,会使应用成为延长的烟囱,不利于解决数据不真实、数据难以积累和数据对接成本高的问题。应当将知识、经验、统一数据处理能力、甚至图谱能力沉降于数据平台。我认为这个数据平台是基础,是不能逾越的建设步骤。


第三、如何理解刚刚描述的这个大数据平台,我认为这个数据平台是开放的,它搭载基础的解析能力,通过一些数据剖析、辅助审判的实用小工具向各数据提供方输出规范化的数据结果。不断的将标准的知识体系、业务逻辑和方法赋予这个平台。而不是一个个系统、应用的简单迭代。一方面,平台满足与其他行政机关、合作单位的数据对接需求;一方面,以开放的姿态,支持各种应用厂商针对不同的需求在这个数据的大平台上搭建特色化的应用。简单来说就是平台对接平台、平台对接系统、平台承载应用、平台汇聚数据、平台提供服务。我希望在解决应用的标准化和可评测之前,解决底层的规制化大数据平台建设问题,这是路基,也是我们迈向 AI 进入物联网时代的脚踏石。


第四、重视智慧法治建设的多元性。我和国双工业物联网领域的一位负责人聊天,他和我说,用我们全球先进的工业物联网级别的能耗监测系统,可以为全国 3500 家法院,每年减少 100 个亿的能耗支出,这是不是智慧法院解决方案啊;我和信永中和会计师事务所的咨询团队谈数据化审计,他们说法院可以全数据化绩效评审,这是不是智慧法院解决方案啊;我与 ARM 沟通数据双生理论时,想到能不能在中国的统一司法政务体系,全数据化重构一个法官、一个检察官、一个案件、一个被羁押人、一套管理机制,是不是用工业物联网的成熟方案也能移植到智慧法治中来,实现我们司法领域的数据双生。以上这都应该是法律人工智能、智慧法治建设需要考虑的。我们现在投入建设的智慧法院的解决方案可能只是智慧法院中的一个局部。


我们发现,在司法人工智能这个命题下很多东西还待思索、待论证、待实施、待创造。我们在迎接未来,因此我们需要专业领域的交叉人才、高层人才;需要脚踏实地的建设者和高屋建瓴的构架者;需要对未来的畅想和对现阶段的清醒认识。我想这就是今天,我们这个实验室成立的重要性和初衷。这个实验室应当是开放的,博大精深的,理性的,实干的。有了实验室,我们可以提升整个群体,特别是领导层和决策层的科学认知;培养更多的跨域专家;提出更优秀的建设理论;探讨更前沿的法学问题,争取更广泛的协同。


我们站在未来的起点上。我们已经做的很好了,在智慧司法上,各种理念、应用、产品百花齐放、百舸争流。这说明我们有很好的时代,有很好的基础。但我们需要清醒的认识,现在仍然是数据建设的初级阶段、人工智能建设的萌芽阶段。因此我们走到一起,寻求共同的目标,用这种顶尖实验室的形式,解决体制、政策、市场不好解决、甚至无法解决的问题。在“积极稳健”、“专业科学”的建设原则下,探索智慧司法的方向。


未来已来,我们身在其中,为之努力。

《实现司法人工智能的国双道路》——国双司法大数据事业部总经理王锰

我的发言分为五个部分,核心是分享我们对司法大数据的理解以及在应用上的经验。


国双公司 2005 年成立,2016 年在纳斯达克上市,是中国最早的数据技术专业厂商之一。


2015 年,国双将大数据理念及相技术应用到了司法领域,推出了一款文书搜索和分析的产品 Law Dissector ,并与人民法院出版集团合作,在 2016 年成功上线了中国第一家法律知识服务和案例大数据服务深度融合的法律平台——法信。


法信被周强院长评价为一款能提供“智能”服务的产品,我们以此拉开了在司法这个领域快速发展的序幕。


以下我介绍国双如何理解智慧法治建设和司法人工智能之间的关系。


司法改革和信息化是“车之两轮、鸟之双翼”。 习近平总书记指出,要遵循司法规律,把深化司法体制改革和现代科技应用结合起来,不断完善和发展中国特色社会主义司法制度。前中共中央政治局委员、中央政法委书记孟建柱强调,要更加积极主动拥抱大数据、人工智能新时代,把理念思路提升、体制机制创新、现代科技应用和法律制度完善结合起来,全面深化司法体制改革,努力创造更高水平的社会主义司法文明。建设司法人工智能是题中之意。


国双认为,司法人工智能,是一整套解决方案,用以模拟和扩展人在司法实践中的工作方法和决策过程。解决方案本质是利用大数据驱动办公自动化,利用大数据支撑决策智能化。我们可以将对法律问题的处理转换为数据流,进行数据拆分和重构:一方面注重将当事人、律师、检察官、法官的工作场景工具化,提供简便、易用的工具来优化现有的工作方式;一方面在关键工作节点上,针对不同对象提供特定的知识服务和数据分析,实现知识服务、数据分析的精准化推送;同时,将整个过程中收集、沉淀的法律人专业经验、智慧加以沉淀、固化,形成可以复用、扩展的数据和服务。


其中,最重要的一点就是,法律人工智能需要完整、科学的数据构架,才能支撑法律智能的的后续建设。


2017 年是我们司法业务真正走入市场的第一年,我们接触了数百家用户、并与很多的同行甚至跨行业的合作伙伴进行了紧密的配合。我们取得了很多的成绩,比如:


  • 第一个基于 NLP 的智能推送的应用的开发;

  • 第一个将解析技术与传统的知识库(知识地图)融合应用;

  • 第一个将 OLAP 技术与传统 OA 体系的数据列表结合,实现展示级别的剖析;

  • 第一个搭建知识图谱并产生应用;

  • 第一个提出物联网建设、是智慧法治建设的重要一环,在司法、司法行政领域提出政务物联网的建设概念;并开始投入建设。


国双在司法垂直领域下,搭建司法人工智能解决方案的核心能力包括:基于自然语言识别的文本解析能力,基于司法专家经验凝练的要素模型的类案推送能力,尝试将法律知识、法律文书与实务经验进行知识融合的司法知识图谱构建能力,以法律事件和法律行为为基础的事理图谱构建能力,能够支持口语化输入、长文本输入的智能检索能力,与腾讯共同搭建的语音基础输出能力,以及成熟、稳定的大数据平台等七大能力。



以图谱为例,为了解决精准推送和分场景推送问题,我们搭建了司法的知识图谱和事理图谱。这四幅图是我们搭建的不同类型的图谱构架。


图谱的建设充分体现出司法人工智能从司法实践中来,比如我们图谱中的要素体系就是来自于司法改革的要素式审判的司法实践经验。


同时司法人工智能反哺司法实践,比如我们用工具、节点主动推送的方式可以很好的辅助审判规范化走出电子书的格局,落实到审判工作中去。


基于我们的技术积累和两年左右的探索,我们已经形成了一整套的司法人工智能解决方案。包括远程诉讼服务、智讼·办案辅助、审判决策辅助、知识产权案例指导四大解决方案。在法院业务的各业务流程节点上提供智能支持。“智慧法院”解决方案在诉讼阶段,提供在线调解、远程立案、在线诉费交纳、证据交换、在线质证、在线问询、远程庭审、电子送达、知识库推送等全流程支持,实现足不出户即可参与诉讼活动。在具体办案阶段,提供语音庭审、裁判文书自动生成、电子卷宗智能管理、关联信息随案推送、智能问答服务等全方位的办案辅助。针对法院管理决策,通过司法舆情监测、类案判决预警等服务,为法院管理层提供智能的决策辅助。此外,为深入研究案例指导制度、统一裁判标准,为法官、律师以及社会公众提供了凝结法律智慧的案例指导服务。


2018 年,在司法人工智能方面,我们会在三方面产品上着力:第一、与审判规范化相结合的主动推送与业务工具;第二、基于数据的第三方中立评估;第三、辅助法院工作的智能问答。


国双作为一个大数据公司,在人工智能的实践上都是以数据的角度出发,源于数据,归于数据。我们一切的产出,都是紧紧的抓住数据应用这个核心,一方面,逐步为获取数据建立系统生态,一方面,从现有的数据利用开始、一步步将智能这个主题深化。我们推出的微诉平台,就是远程审判产生新类型数据应用。我们还在探索司法类数据与金融投研类数据做打通。司法是整个社会生活中的一环,司法数据也需要与更多元、更多种的数据结合起来才能发挥更大的效用。



司法人工智能的国双道路,现阶段可以总结为以现有的文书数据、知识数据、流程数据,和大数据平台技术为基础,通过对行业深度认识的数据转化,将司法经验、知识、审判规范积累,组织在各类图谱中。最后通过图谱在业务节点上的输出,实现智能问答辅助审判。


以上,就是我们在实现法律人工智能道路上的一些体悟,希望和在座的嘉宾分享,希望与更多的伙伴携手共赢。


谢谢大家。


国双司法大数据事业部咨询总监李斌作为第二单元“法律人工智能技术的发展”的评论人,总结道:

前两天听到一个概念叫做“极端不对称竞争”,认为当今世界上出现了三种“新机器”,或者说是三种智能,分别是机器(智能)、平台(智能)、大众(智能)。和这三种“机器”相对应的,是传统人脑、产品和公司。人脑和机器、产品和平台、公司和大众之间的竞争,是一种极端不对称的竞争。

在法律行业,为什么要面对这种机器竞争,法律人怎么做?我想强调两点:首先,人工智能所仰赖的数据养料,在法律行业尚嫌不足。我们现在所赖于训练的法律人工智能的数据级还是非常少的,而且数据来源基本都是公开的文书,法院、检察院还有很多的文书种类,包括各行各业像工商数据爬取、企业数据爬取等,这些数据都没有利用起来作为整个法律人工智能的依据。现在所谓的法律人工智能第一匮乏的是相应数据。

第二,是人才匮乏。希望有更多的有识之士,甚至年轻毕业生、高校,包括今天北大法律人工智能实验室的设立应该着重于相关人才的交叉学科建设以及人才培养,必须着眼未来,未来需要什么样的法律科技和需要什么样的法律人工智能,没有人才的积淀和数据的积淀,我认为都是空中楼阁。

如果说数据是 21 世纪的石油,每一个法律 AI 从业者可以称之为时代的矿工。借用上个月冯象老师“全世界机器人团结起来”的 slogan,希望全世界或者是在座的各位法律矿工联合起来一起共创法律人的未来,谢谢!


本文转载自公众号国双 Gridsum(ID:gridsumtech)。


原文链接:


https://mp.weixin.qq.com/s/liNifRBSx3PsztzTYSiXLA


2019-10-10 23:51741

评论

发布
暂无评论
发现更多内容

动态控制SAP C4C UI元素的显示和隐藏

Jerry Wang

CRM SAP C4C Cloud for Customer

如何将Twitter的内容导入到SAP CRM和C4C

Jerry Wang

twitter CRM SAP C4C Cloud for Customer

SAP成都C4C小李探花:浅谈Fiori Design Guidelines

Jerry Wang

大前端 Fiori SAP UI5

双非渣硕也能上岸?痛述阿里Java岗7轮技术面经历,险幸上岸

Java 程序员 架构 面试

redis sentinel架构

王瑞强

使用Excel调用ABAP系统的函数

Jerry Wang

Excel Office SAP abap

使用ABAP和JavaScript代码生成PDF文件的几种方式

Jerry Wang

JavaScript PDF abap Acrobat

为什么5、6月会空缺出大量技术岗?跳槽注意事项+面试官关心什么

Java架构师迁哥

SAP CRM WebClient UI里的文件是如何上传到ABAP Netweaver后台的

Jerry Wang

chrome CRM SAP WebClient UI

ABAP Netweaver, Hybris Commerce和SAP 云平台的登录认证

Jerry Wang

abap Netweaver Hybris Commerce Cloud

存储技术入门,这些硬件应该首先有所了解

SunnyZhang的IT世界

服务器 存储 交换机 san

UI5 Source code map机制的细节介绍

Jerry Wang

JavaScript SAP SAP UI5

SAP CRM WebClient UI和Hybris backoffice UI开发的相同点

Jerry Wang

CRM SAP abap WebClient UI Hybris

华为HMS生态和1+8+N的交叉点,点透棋局的华为帐号

脑极体

简单了解 MySQL 中相关的锁

leonsh

MySQL 后端

面向WEB开发人员的Docker(五):部署开发WordPress

devpoint

Docker Wordpress 部署 Docker-compose

IO

ltc

IO流

UI5应用部署到Fiori On-Premise和On-Cloud的Launchpad

Jerry Wang

Fiori SAP UI5 Launchpad

Dubbo 路由规则之条件路由

青年IT男

dubbo

SAP Netweaver和Hybris的数据库层

Jerry Wang

abap Hybris

超级详细!全网独家首发的SpringCloud Alibaba 到底有多强?

Java 程序员 架构 面试

5分钟速读之Rust权威指南(八)

wzx

rust

(VMware)ubuntu环境下搭建Swarm+Stack一站式部署容器集群

逸少

Docker Docker Swarm Docker-compose Ubuntu20.04

WLS2搭建Django部署环境

IT蜗壳-Tango

5月日更

论:在996的天下,Java程序员该如何高效学习

Java架构师迁哥

C4C和CRM里获取当前登录用户分配的Organization Unit

Jerry Wang

CRM SAP C4C Cloud for Customer

使用Excel消费C4C的OData service

Jerry Wang

Excel SAP C4C OData

SAP CRM, C4C和Hybris的后台作业

Jerry Wang

CRM SAP C4C Hybris

throw与throws的区别学习笔记

风翱

异常 5月日更

数据湖vs数据仓库vs数据集市

数据社

数据仓库 数据湖 5月日更

科大讯飞语音转文字以及中文分词的Java测试代码

Jerry Wang

Java 人工智能

实现司法人工智能的国双道路_AI&大模型_国双_InfoQ精选文章