法律AI資料及應用

2022-04-10 00:08:46 字數 3448 閱讀 7361

本文簡單列舉了法律ai目前的應用,資料集,研究方向。

2023年,buchanan和headrick發表文章「關於人工智慧和法律推理的一些猜測」,討論了對法律研究和推理進行建模的可能性,特別是對於建議、法律分析的構建。

2023年,taxman系統的**,該**以公司稅法中的問題為緣由提供了乙個定理證明的方法。基於他對這個早期系統的研究經驗,他還研究開發法律概念的深層模型,如稅法背景下的股權問題。

到了20世紀80年代,人工智慧和法律工作得到了極大的關注。2023年,蘭德公司民事司法中心的唐納德沃特曼和馬克彼得森為《侵權法》中產品責任案件的和解建立了法律決策專家系統;他們後來**了在石棉肺病特定領域使用專家系統的情況。倫敦帝國理工學院的marek sergot,robert kowalski和他們的同事使用邏輯程式設計來模擬《英國國籍法》的一部分,這是一部龐大而獨立的法令。

20世紀80年代,人工智慧的興趣顯著增加,研究界愈演愈烈。一些專業會議,如佛羅倫斯idg和休斯敦大學的會議,緊接著是專門針對普通人工智慧受眾ijcai-85。日本的人工智慧和法律研究也開始於這一時期,東京明治大學 hajime yoshino的實驗室就是其中的。日本第五代計算機系統工程(1982-1995)提供了很大的動力,特別是在使用專家系統和其他基於邏輯的技術方面的發展。

到20世紀80年代中期,美國一些主要的法學院也開始舉辦關於人工智慧和法律的研討會。第一次是在2023年斯坦福法學院,由三位法學教授:保羅·布雷斯特(後來成為院長)、湯姆·海勒和鮑勃·麥克諾肯。2023年,rissland在哈佛法學院舉辦了關於人工智慧和法律推理的研討會。2023年,伯曼和哈夫納在美國東北大學舉辦了他們的研討會,此後每兩年召開一次大會。該會的主要涉及的研究題目包括形式法律推理的模型、論證和決策的計算模式、運用證據推理的計算模式、多重角色參與的法律推理系統、可執行的立法程式模式、自動化的法律文獻分類和總結、機器學習和電子發現的資料運用以及其他相關領域。

2023年,國際人工智慧和法律協會的成立。多年來,這些研討會層出不窮,並成為匯集ai和法律界的論壇。

摘自cail2018的ppt報告。

任務名稱

解釋智慧型案例檢索

類案推薦,非普通文字檢索

判決**

**刑期、相關法條、罪名

文書自動生成

通常用於裁判文書生成

法律智慧型推薦

法律文字翻譯

機器翻譯在法律領域的應用

法律智慧型問答

法律諮詢,對話系統

風險提示

閱讀理解。合同、協議等

法律文字挖掘

使用判例的資料點,贏/損失率和法官的歷史,用於趨勢和模式

合規審查

列出部分。翻譯自icail2019

法律ai任務形式化程度較低,比較少見leaderboard形式的比賽。

cail2018

源自裁判文書網。**罪名、相關法條、刑期

裁判文書網

包含全國的大部分裁判文書原始資料

cail2019(未開放)

會包含多個與nlp具體任務相關的法律資料集。思路是公司和主辦方和辦比賽,定義問題、定義資料集。

法律只能方面的開放資料,大部分是原始資料,與ai任務不直接關聯。下面幾個資料集引用自10-best-legal-datasets-for-machine-learning.

legal case reports data set

機器學習任務相關。自動摘要、引證分析。

department of justice open data

高質量的開放資料集,並非面向具體任務。包括多個具體的資料庫,如暴力犯罪案例、fbi犯罪報告、統計報告等。

the supreme court database

200多個美國最高法院的案例,自2023年開始到2023年。

caselaw access project (cap)

包含美國360年的判例法(以判例形式出現的法律,英文名為caselaw)。

bureau of justice

美國的一些執法機構、監獄、假釋、緩刑資料

carp-manning u.s. district court database

暫時無法訪問。包含2023年開始的110000多個美國聯邦地方法院的判決。

patent litigations

包含72000個案例資訊,跨度52年。包含當事人、律師、訴訟結果、時間、地點資訊。

google patents public data

國際專利制度相關的公開資料。

california crime and law enforcement

加州的犯罪率、執法公開資料

credit card agreement database

各信用卡發行單位的信用卡協議

kaggle上也有一些法律、犯罪等方面的開放資料集,有些包括具體任務,有些不包括具體任務:

芝加哥犯罪資料

不包括具體任務

舊金山犯罪分類的比賽

分類**任務

cail2018

kaggle上關於舊金山犯罪分類的比賽

lawgeex

lawgeex與史丹福大學、杜克大學法學院和南加州大學。內容是四小時審查五項保密協議(nda),並確定30個法律問題,包括仲裁,關係保密和賠償。在這場比賽裡,人類律師的平均準確率達到了85%,而ai的準確率達到了95%。ai也在26秒內完成了任務,而人類律師平均需要92分鐘。

國際人工智慧與法律會議icail

摘自best artificial intelligence (ai) software for law firms和5 lawyer bots you can try now,列舉了目前在商業中使用的一些法律人工智慧服務。

主要面向合約檔案分析。

合同分析。合同條款提取

合同審查

租賃條款提取

主要面向律師事務所,提高律師處理case的效率。主要包括:

類案檢索;

特定的排序、檢索需求;

面向律師事務所,文件管理系統,並非只針對法律領域。高效管理文件、抽取資訊。

面向律師事務所。法律檔案分析,提示需要重點關注的地方。

面向公司。提供法律建議、法律風險規避。

為律師事務所或公司的法律顧問服務。挖歷史掘訴訟資料,為使用者提供有用資訊。

面向一般使用者,幫助起草協議。通過自動向使用者提一些問題,根據使用者的回答生成協議。目前也支援起草房屋租賃等商業合同。

面向一般使用者的法律諮詢機械人,以對話系統方式提供服務。可以提供基本的法律資訊,也可以幫助使用者找到律師或調解員。

面向律師事務所。乙個服務平台,幫助律師建立自己的律師機械人,提高面向使用者的問答效率,也可以起草文書等。

面向一般使用者。幫助使用者申訴不合理的停車費。

視覺理論 AI的本質及價值及應用

本質 一種獲取知識 運用知識來達到目標的通用能力.關鍵要素 ai的價值 基於使用者業務場景,解決使用者痛點 業務場景 安防,金融,自動駕駛,醫療,零售,工業,庫存管理等 使用者痛點 人工成本,資料的量級,非結構化資料 安防場景 公安 抓逃犯,小偷 交警 抓違法車,人 城管 亂擺攤 司法 監獄裡面行為...

對AI的理解及應用的思考

序號 學習方法地位1 強化學習 reinforcement learning 猶如蛋糕上的一顆櫻桃 2監督學習 supervised learning 猶如蛋糕外的一層糖霜 3無監督學習 學習 unsupervised predictive learning 才是蛋糕本身 到目前為此 2017.3 ...

AI應用開發實戰

目前,人工智慧在語音 文字 影象的識別與解析領域帶來了跨越式的發展,各種框架 演算法如雨後春筍一般,網際網路上隨處可見與機器學習有關的學習資源,各大mooc平台 部落格 公開課都推出了自己的學習資料。在當前學習資料十分豐富的這個環境下,本教程從上手的角度,讓大家能夠真正動手開始進行ai的開發,提高大...