法律AI資料及應用

本文簡單列舉了法律ai目前的應用，資料集，研究方向。

2023年，buchanan和headrick發表文章「關於人工智慧和法律推理的一些猜測」，討論了對法律研究和推理進行建模的可能性，特別是對於建議、法律分析的構建。

2023年，taxman系統的**，該**以公司稅法中的問題為緣由提供了乙個定理證明的方法。基於他對這個早期系統的研究經驗，他還研究開發法律概念的深層模型，如稅法背景下的股權問題。

到了20世紀80年代，人工智慧和法律工作得到了極大的關注。2023年，蘭德公司民事司法中心的唐納德沃特曼和馬克彼得森為《侵權法》中產品責任案件的和解建立了法律決策專家系統；他們後來**了在石棉肺病特定領域使用專家系統的情況。倫敦帝國理工學院的marek sergot，robert kowalski和他們的同事使用邏輯程式設計來模擬《英國國籍法》的一部分，這是一部龐大而獨立的法令。

20世紀80年代，人工智慧的興趣顯著增加，研究界愈演愈烈。一些專業會議，如佛羅倫斯idg和休斯敦大學的會議，緊接著是專門針對普通人工智慧受眾ijcai-85。日本的人工智慧和法律研究也開始於這一時期，東京明治大學 hajime yoshino的實驗室就是其中的。日本第五代計算機系統工程(1982-1995)提供了很大的動力，特別是在使用專家系統和其他基於邏輯的技術方面的發展。

到20世紀80年代中期，美國一些主要的法學院也開始舉辦關於人工智慧和法律的研討會。第一次是在2023年斯坦福法學院，由三位法學教授：保羅·布雷斯特(後來成為院長)、湯姆·海勒和鮑勃·麥克諾肯。2023年，rissland在哈佛法學院舉辦了關於人工智慧和法律推理的研討會。2023年，伯曼和哈夫納在美國東北大學舉辦了他們的研討會，此後每兩年召開一次大會。該會的主要涉及的研究題目包括形式法律推理的模型、論證和決策的計算模式、運用證據推理的計算模式、多重角色參與的法律推理系統、可執行的立法程式模式、自動化的法律文獻分類和總結、機器學習和電子發現的資料運用以及其他相關領域。

2023年，國際人工智慧和法律協會的成立。多年來，這些研討會層出不窮，並成為匯集ai和法律界的論壇。

摘自cail2018的ppt報告。

任務名稱

解釋智慧型案例檢索

類案推薦，非普通文字檢索

判決**

**刑期、相關法條、罪名

文書自動生成

通常用於裁判文書生成

法律智慧型推薦

法律文字翻譯

機器翻譯在法律領域的應用

法律智慧型問答

法律諮詢，對話系統

風險提示

閱讀理解。合同、協議等

法律文字挖掘

使用判例的資料點，贏/損失率和法官的歷史，用於趨勢和模式

合規審查

列出部分。翻譯自icail2019

法律ai任務形式化程度較低，比較少見leaderboard形式的比賽。

cail2018

源自裁判文書網。**罪名、相關法條、刑期

裁判文書網

包含全國的大部分裁判文書原始資料

cail2019(未開放)

會包含多個與nlp具體任務相關的法律資料集。思路是公司和主辦方和辦比賽，定義問題、定義資料集。

法律只能方面的開放資料，大部分是原始資料，與ai任務不直接關聯。下面幾個資料集引用自10-best-legal-datasets-for-machine-learning.

legal case reports data set

機器學習任務相關。自動摘要、引證分析。

department of justice open data

高質量的開放資料集，並非面向具體任務。包括多個具體的資料庫，如暴力犯罪案例、fbi犯罪報告、統計報告等。

the supreme court database

200多個美國最高法院的案例，自2023年開始到2023年。

caselaw access project (cap)

包含美國360年的判例法（以判例形式出現的法律，英文名為caselaw）。

bureau of justice

美國的一些執法機構、監獄、假釋、緩刑資料

carp-manning u.s. district court database

暫時無法訪問。包含2023年開始的110000多個美國聯邦地方法院的判決。

patent litigations

包含72000個案例資訊，跨度52年。包含當事人、律師、訴訟結果、時間、地點資訊。

google patents public data

國際專利制度相關的公開資料。

california crime and law enforcement

加州的犯罪率、執法公開資料

credit card agreement database

各信用卡發行單位的信用卡協議

kaggle上也有一些法律、犯罪等方面的開放資料集，有些包括具體任務，有些不包括具體任務：

芝加哥犯罪資料

不包括具體任務

舊金山犯罪分類的比賽

分類**任務

cail2018

kaggle上關於舊金山犯罪分類的比賽

lawgeex

lawgeex與史丹福大學、杜克大學法學院和南加州大學。內容是四小時審查五項保密協議（nda），並確定30個法律問題，包括仲裁，關係保密和賠償。在這場比賽裡，人類律師的平均準確率達到了85％，而ai的準確率達到了95％。ai也在26秒內完成了任務，而人類律師平均需要92分鐘。

國際人工智慧與法律會議icail

摘自best artificial intelligence (ai) software for law firms和5 lawyer bots you can try now，列舉了目前在商業中使用的一些法律人工智慧服務。

主要面向合約檔案分析。

合同分析。合同條款提取

合同審查

租賃條款提取

主要面向律師事務所，提高律師處理case的效率。主要包括：

類案檢索；

特定的排序、檢索需求；

面向律師事務所，文件管理系統，並非只針對法律領域。高效管理文件、抽取資訊。

面向律師事務所。法律檔案分析，提示需要重點關注的地方。

面向公司。提供法律建議、法律風險規避。

為律師事務所或公司的法律顧問服務。挖歷史掘訴訟資料，為使用者提供有用資訊。

面向一般使用者，幫助起草協議。通過自動向使用者提一些問題，根據使用者的回答生成協議。目前也支援起草房屋租賃等商業合同。

面向一般使用者的法律諮詢機械人，以對話系統方式提供服務。可以提供基本的法律資訊，也可以幫助使用者找到律師或調解員。

面向律師事務所。乙個服務平台，幫助律師建立自己的律師機械人，提高面向使用者的問答效率，也可以起草文書等。

面向一般使用者。幫助使用者申訴不合理的停車費。

法律AI資料及應用

視覺理論 AI的本質及價值及應用

對AI的理解及應用的思考

AI應用開發實戰

法律AI資料及應用

視覺理論 AI的本質及價值及應用

對AI的理解及應用的思考

AI應用開發實戰

相關推薦