“法的交叉學科沙龍”回顧篇
自2018年4月以來,由上海交通大學中國法與社會研究院主辦的“法的學科交叉沙龍”已經成功舉辦五講。五位在人工智能和大數(shù)據(jù)領域造詣深厚的專家與法學學者就技術在司法中的應用共同交流。
第一講
2018年4月24日,“法的學科交叉沙龍”第一講在凱原法學院舉行。沙龍第一講由上海交大安泰經濟與管理學院沈惠璋教授主講,主題為“人工智能、大數(shù)據(jù)與司法決策”。凱原法學院季衛(wèi)東教授主持了本次沙龍,媒體與傳播學院徐劍教授、凱原法學院林喜芬教授擔任評議人。
季衛(wèi)東教授首先感謝沈惠璋教授主講本次沙龍。沈教授長期從事系統(tǒng)工程和信息系統(tǒng)的研究,也是決策科學領域重要的學者。凱原法學院法社會學研究中心歷來重視學科交叉研究,歡迎在人工智能和大數(shù)據(jù)領域造詣深厚的專家共同為技術在司法中的應用提供幫助、相互交流。
沈惠璋教授開宗明義,主張從計算機科學發(fā)展的歷史脈絡來深入了解計算機科學、人工智能和大數(shù)據(jù)的理論本質,由此洞悉它們的發(fā)展前景和對司法領域可能的輔助作用。他以最早普及的人工智能產品傻瓜相機為例,介紹了終端用戶、設計師、科學家和思想家的分工層次,指出只有涌現(xiàn)一批計算機領域的科學家和思想家、對現(xiàn)有基礎理論做出重大突破,中國才能真正實現(xiàn)自主創(chuàng)新,走在世界人工智能領域前沿。沈教授從數(shù)學和邏輯學的發(fā)展歷程出發(fā),強調可計算性理論和圖靈機模型是現(xiàn)代計算機科學的理論基礎,而哥德爾不完備性定理決定了任何一個數(shù)學系統(tǒng)不可能既是自洽的,又是完備的,“停機問題”證否了“無所不能的程序”的存在。因此計算機程序不可能對所有問題都提供有效的算法,在當今時代我們尤其要分清理論發(fā)展和商業(yè)炒作,不能陷入理解的誤區(qū)和盲目的恐慌。同樣地,盡管人工智能注定會在一定程度上影響和改變司法決策,但是人工智能并不能完全取代人的作用。
接著,沈惠璋教授介紹了人工智能、機器學習和大數(shù)據(jù)的概念和特點,他提到深度學習本身不是邏輯推理,而是一種信號轉化與模式識別,突出誤差的比較;而司法之中是有說理的,比如被判刑的人會追問“為什么”、“憑什么”?在這種情況下要留意技術本身的局限性。在這里,沈老師展望了人工智能在司法決策中可能的幾個應用方向,這主要體現(xiàn)為四個方面:數(shù)據(jù)挖掘的決策樹算法在司法決策中用于知識發(fā)現(xiàn)、司法決策專家系統(tǒng)、基于范例推理的司法決策支持系統(tǒng)和群體司法決策支持系統(tǒng)。他還詳細地講解了神經網絡算法及其理論局限,介紹了決策樹、專家系統(tǒng)、范例推理和群體決策系統(tǒng)等技術,并展望了它們在司法領域的應用前景。
評議階段,徐劍教授首先感謝沈惠璋教授嚴謹客觀地梳理了人工智能發(fā)展的歷程,指出司法公開使我們擁有了非常好的學習集,問題在于如何處理和使用這個學習集。林喜芬教授首先討論了人工智能黑箱性質的可靠性與司法倫理,指出司法過程的實際運轉可能并不是決策樹式的樹形模式。他還提到,盡管一般認為法律推理是按照三段論式的形式邏輯模式,但是法律現(xiàn)實主義等新的思潮和理論是反對這樣的法律形式主義的,英美法系的司法決策很多時候也并不滿足這個模式。兩位老師的評議也充分體現(xiàn)了信息技術與法學的交叉效應,達到了非常好的對話效果。
交流互動環(huán)節(jié),現(xiàn)場聽眾就人工智能與人的智能的潛能和局限與沈惠璋教授進行了深入探討。沈教授談到,當前的技術發(fā)展日新月異,但實質上突破性的進展還是比較緩慢的,尤其我們國家對核心技術的掌握尚有不足,這需要數(shù)代人的接力、積累。而就信息技術而言,難點在于如何獲取知識、如何采用統(tǒng)一的語言來表述這種知識以及如何靈活處理僵硬的判斷結果,這都是法學將信息技術引入探討的任務之一。
季衛(wèi)東教授做總結發(fā)言,他認為沈教授的講座非常有啟發(fā)性,他從哈特的可撤銷原理和法律系統(tǒng)的自我指涉問題出發(fā)做了精彩的回應。最后,他代表法社會學研究中心感謝沈惠璋教授做客本次法的學科交叉沙龍,首次交叉沙龍活動宣告圓滿結束。
第二講
2018年5月8日,“法的學科交叉沙龍”第二講在凱原法學院舉行。此次沙龍由電子信息與電氣工程學院金耀輝教授主講,主題為“司法信息化中的人工智能:歷史、挑戰(zhàn)、實踐與愿景”。凱原法學院季衛(wèi)東教授主持了本次沙龍,程金華教授和許多奇教授擔任評議人。
季衛(wèi)東教授首先歡迎金耀輝教授主講本次沙龍。他介紹道,學科交叉沙龍旨在借助交大的優(yōu)勢和特色,推動跨學科交叉研究。金耀輝教授從著名的貝爾實驗室回國后參與了多項重大科研和應用項目,近年來對法學交叉研究也有高度關注。
金耀輝教授的講座分為歷史、現(xiàn)實、思考和前瞻四個部分,梳理了人工智能發(fā)展歷史,介紹了人工智能在司法領域的應用現(xiàn)狀,分析了具體的實踐應用項目,并展望了未來人工智能與法律研究和應用的遠景。
他首先簡述了人工智能的三大流派和發(fā)展史:以數(shù)理邏輯模擬人的心智的符號學派、以仿生學模擬腦的結構的聯(lián)結學派和以控制論模擬人類行為的行為學派。他還講解了機器學習的基本概念和原理,認為特征選取是機器學習成敗的關鍵。針對近年來大火的深度學習,金耀輝教授認為盡管深度學習的計算能力和特征刻畫能力十分強,但是模型的可解釋性也在下降。為此,“可解釋性人工智能”(Explainable Artificial Intelligence, XAI)的概念被提出,目的在于突破算法黑箱的限制,為數(shù)據(jù)處理和運算結果提供邏輯解釋。
金耀輝教授回顧了人工智能與法律的結合。他指出,上世紀中葉人工智能誕生之初就有學者設想借助這一技術實現(xiàn)法律的自動化處理,而以1970年Buchanan & Headrick《關于人工智能和法律推理若干問題的考察》一文發(fā)表為標志,人工智能與法律作為研究分支正式誕生。當前司法信息化中人工智能的應用十分廣泛,美國的Case Crunch對案件結果的預測甚至超過了人類律師。他總結道,人工智能與法律結合的必要性體現(xiàn)在可以提高司法效率、促進司法公正、提升立法質量。
接下來,金耀輝教授介紹了自己團隊研發(fā)的OMNIRank模型。該模型利用人工智能算法預測P2P平臺的風險狀況。通過5大類118個特征、6種深度學習算法,該模型的準確率可以達到85%。但是正因為人工智能的算法黑箱性質,無法對預測結果提供邏輯解釋,因此在實際應用中遇到了困難。金耀輝團隊進一步嘗試了“元思”系統(tǒng),通過輸入模糊的先驗人工邏輯,并在優(yōu)化迭代中輔以少量人工校驗和干預,可以大幅提升算法性能。該系統(tǒng)未來有望在司法實務中用于類案研究。金耀輝教授還以四川眉山的多元化社會調解為例,介紹了社會管理的AI流程。
最后,金耀輝教授展望了人工智能司法應用的遠景。他指出,當前人工智能的研究和應用還處于初級階段,法律具有獨特的復雜性和模糊性,這為未來研究提出了挑戰(zhàn),更孕育著廣闊的契機。人工智能在法律的深度、實質應用需要面對法律、管理、技術、數(shù)據(jù)和人才等多方面的挑戰(zhàn)。
季衛(wèi)東教授感謝金耀輝教授精彩的匯報。他總結道,大數(shù)據(jù)、互聯(lián)網和人工智能的三元互動是理解人工智能與法的關鍵因素。未來人工智能的司法應用需要突破算法黑箱,滿足可解釋性。
評議討論階段,程金華教授首先感謝金耀輝教授的分享。他提出,機器學習的運算多是基于回歸原理,利用舊有的規(guī)律和趨勢對未來進行預測,但是法律的發(fā)展除了依據(jù)以往的規(guī)律經驗,還需要不斷優(yōu)化調整,將法律實踐推向更高更好的層次,這一點在疑難和復雜案件中會尤其突出。季衛(wèi)東教授也認為,這實際上涉及到了一個重要的法律問題。模糊的先驗選擇到人工智能需要經過清晰的邏輯處理,其中需要多次的邏輯迭代。但同時法律的發(fā)展也需要優(yōu)化選擇。如何平衡二者是需要認真研究的。許多奇教授也指出,對于復雜前沿的法律案例,在法解釋學的內部也莫衷一是,對于這類情況人工智能可以發(fā)揮怎樣的作用?關于P2P平臺風險模型,人工智能的模型是利用過往數(shù)據(jù)對未來預測,但是在當前防范系統(tǒng)性金融風險、政策出臺迅速的大背景下,原有方法是否能保持良好的準確度也是值得探討的問題。
第三講
2018年5月22日,“法的交叉學科沙龍”第三講在法學樓203會議室成功舉辦,主講人上海交通大學國際關系與公共事務學院樊博教授就“大數(shù)據(jù)、人工智能與城市應急”進行了精彩演講。講座由凱原法學院季衛(wèi)東教授主持,由朱芒教授、李學堯教授擔當評議。
樊博教授首先就“法的交叉學科沙龍”的邀請表示了感謝,并幽默地表示他在季衛(wèi)東老師、朱芒老師面前感覺自己好像是博士生開題。樊博教授近年來一直致力于文理交叉研究尤其是信息科學在政府公共管理中的應用,今天來法學院分享的是最近做的兩個案例。
講座分為三塊,首先樊博教授以“大數(shù)據(jù)下的社會科學研究”為題,宏觀地談了大數(shù)據(jù)技術對社會科學研究和人才培養(yǎng)的影響。他認為,傳統(tǒng)量化分析和數(shù)據(jù)分析視角的區(qū)別在于前者自頂向下,從理論建構開始,而后者自底向上,從數(shù)據(jù)處理開始。對于互聯(lián)網+背景下的知識形態(tài),樊博教授認為我們正在經歷知識從個體記憶向云端存儲轉變、知識碎片向數(shù)據(jù)結構化轉變、數(shù)據(jù)結構化向智能化轉變的過程,因此今后應更加注重培養(yǎng)學生的信息檢索能力,并展現(xiàn)了國務學院最近的本科培養(yǎng)方案。關于政府公共服務的走向,樊博教授認為未來的電子政府將把流程而非職能作為基本單位,從金字塔式管理模式轉向扁平的網絡模式,政府層級間的橫縱整合、部門間的信息共享將成為趨勢。第二塊“大數(shù)據(jù)下的應急管理網格研究”中,樊博教授以他自己最近親自參與的案例為例,展示了如何利用消防部門的出警數(shù)據(jù)尋找地理空間因素與火災風險的關聯(lián)性,并進而搭建出風險預警的網格模型。第三塊“大數(shù)據(jù)下的應急恢復力研究”中,樊博教授以他與學生合作完成的研究為例,展示了如何利用人民廣場地鐵站刷卡數(shù)據(jù)來計算不同時間段的人流量概率分布,相應開啟的安檢閘機數(shù)量并最終求出為了應對災害發(fā)生而需要儲備的“冗余”閘機數(shù)量。
在點評環(huán)節(jié),季衛(wèi)東教授首先表達了對樊博教授的感謝。同時談到觸類旁通的兩點感想,一是由災害應對中冗余資源的必須存在聯(lián)想到最近的員額制司法改革把法官推向負荷極限,把“冗余”的司法資源統(tǒng)統(tǒng)砍掉。二是贊賞災害恢復力的概念。評議人朱芒教授首先提出一點疑惑,城市管理水平是否等同于技術水平?是否上海通過投入最強的技術力量,就能在社會穩(wěn)定等城市管理諸方面超過紐約、巴黎?換言之,在政府的整體功能沒有改革的前提下,用扁平化的方式提升行政效率能否解決一切問題?
此外,朱芒教授提出了大數(shù)據(jù)應用于城市管理可能給人權保障帶來的挑戰(zhàn),比如通過智能手機進行信息采集帶來政府服務的不公平、地鐵刷卡數(shù)據(jù)的隱私權和安檢的合法性、信息共享平臺下法外因素的考量等等問題。歸結來說,中國面對行政效率提高和法治國家建設的雙重課題,不可偏廢其一。李學堯教授在評議時談到從火災預警系統(tǒng)聯(lián)想到犯罪預警系統(tǒng),用人際關系數(shù)據(jù)代替空間關系數(shù)據(jù),或許將會是公共管理的下一步方向。此外,由災害應急的恢復力可以聯(lián)想到朝代更替的恢復力,而法律制度應該是社會恢復力的重要變量。
在提問環(huán)節(jié),提問者分別提出了應急網格研究中地理信息特征是人抓取還是機器抓取、應急恢復力研究中人流分布的泊松模型如何選取,以及企業(yè)對數(shù)據(jù)的壟斷是否構成對《反壟斷法》的違反等問題。樊博老師耐心對選取的研究案例進行了解釋,并鼓勵法學院的學生對大數(shù)據(jù)應用的合法性問題展開研究。
講座最后,季衛(wèi)東教授又高屋建瓴地歸納了今后如何推動公共管理和法學領域對話的若干可能話題。如冗余資源配置的根據(jù),風險大數(shù)據(jù)的種類,環(huán)境污染的風險,交通整頓中市民的守法意識,城市災害的應對以及企業(yè)產品責任的認定等。法社會學需要理論介入,但更重要是歸納性思考,而學者的價值在于能不能慧眼識珠,找出理論規(guī)律。樊博教授再次對法學院的要求表示感謝,并坦承說,管理學的思路是對既存事物優(yōu)化,可一樣事物該不該存在會不會存在,是管理學不考慮的,因此有許多要向法學請教的地方,也希望未來有更多合作的機會。
第四講
2018年6月19日,“法的交叉學科沙龍”第4講在凱原法學院順利舉辦,上海交通大學科學史與科學文化研究院院長江曉原教授以“科學出版暴利的背后:從開放存取到掠奪性期刊”為主題做報告。講座由季衛(wèi)東教授主持,高全喜教授、王先林教授擔任評議人。
江教授以國際科學期刊出版中的“開放存取運動”為切入,首先介紹了近些年來大批涌現(xiàn)的開放存取期刊的運營機制和利潤空間。他認為,從實際運營的情形來看,“開放存取運動”的存在模式主要體現(xiàn)為:對論文的閱讀者(使用者)免費,論文的撰寫者(發(fā)表者)付費,論文的一部分出版者可以大幅盈利。在開放存取期刊的實際運營中,后兩者是緊密結合在一起的,只有=進入了SCI的開放存取期刊才可以收費,收費的“主流區(qū)間”在每篇論文1500~5000美元之間,收費基本上和該刊的影響因子高低成正比。SCI以外的開放存取期刊通常就無法收費,但因開放存取期刊運營成本極為低廉,所以仍然可以大面積存活。通過揭示開放存取期刊背后的商業(yè)利益驅動,以及開放存取期刊對學術生態(tài)的破壞效應,江教授在此基礎上以翔實的實證研究為基礎向大家揭示了國外不良期刊對中國科研經費的驚人掠取,由此揭開“開放存取運動”的真面目。
隨后,江教授通過一系列數(shù)據(jù)和表格的分析指出,“開放存取運動”的實質在于期刊出版商通過運營開放存取期刊無限制地發(fā)表低端論文謀取暴利,為此不惜嚴重損害科學出版的學術生態(tài)。 “開放存取運動”未在中國大行其道,這應該視為中國科學期刊界的幸運;如果國際科學共同體還有自我修復能力,“開放存取運動”終將盛極而衰,他在講座中反復認真地告誡中國的科學期刊千萬不要去“趟這灘渾水”。在點評環(huán)節(jié),王先林教授和高全喜教授分別從經濟法規(guī)制和科研創(chuàng)新與發(fā)表平臺的角度談論了自己對于“開放存取運動”的看法,講座的參與者熱烈討論、積極提問,現(xiàn)場效果極佳。
第五講
2018年10月15日,“法的交叉學科沙龍”第5講在凱原法學院舉辦,哥倫比亞大學中國法研究中心主任李本(Benjamin Liebman)教授以“中國法院裁判文書的大數(shù)據(jù)化:如何把文本作為數(shù)據(jù)”(Mass Digitization of Chinese Court Decisions: How to Use Text as Data in the Field of Chinese Law)為題,報告了其團隊的兩項近期研究。整個演講圍繞兩個主題展開:首先,我們能從既有數(shù)據(jù)中學到什么?其次,研究者該如何使用司法數(shù)據(jù)?講座由季衛(wèi)東教授主持,由程金華教授擔任評議。
李本教授介紹的第一項已完成研究基于105萬多份河南省的法律裁判文書。該項研究的起始問題是:數(shù)據(jù)庫中包含什么、遺失了什么,又該如何解釋不同法院之間在裁判文書披露上的差異?首先,李本教授團隊搭建的數(shù)據(jù)庫,包括了從河南省高級人民法院網站上下載的全部先于2015年的司法裁判文書,其中絕大多數(shù)案件出現(xiàn)在2006年到2015年之間,而2015年之后的裁判文書則被最高人民法院司法裁判文書網收錄。除了判決書和裁定書外,這百萬份司法裁判文書還包括函書、強制醫(yī)療通知書、申訴通知書、減刑假釋通知書、拘留通知書等,這些文書在過去完全被研究中國法院的西方學界忽視,并且隨著2016年《最高人民法院關于人民法院在互聯(lián)網公布裁判文書的規(guī)定》的出臺在未來將有更大范圍的公開。這個數(shù)據(jù)庫遺漏了什么?2014年河南省法院工作報告載有相關數(shù)據(jù)表明,僅有41%的審結案件被公開,即便考慮到河南約25%的民事案件以不上網的調解書結案,依然有約三分之一本應該上網的裁判文書未得到解釋。此外,該如何解釋一省之內不同法院之間實踐上存在的較大差別(從15%到83%不等)?李本教授笑稱,人均GDP和人口總數(shù)在解釋此一差別時不具備統(tǒng)計上的顯著性,反倒是通過非正式研究發(fā)現(xiàn)法院領導的角色具有很大的解釋力,一語引起全場會心的笑聲。
緊接著李本教授又介紹了還在進行之中的、基于全國4000萬份裁判文書的第二項研究。這項研究采用基于無監(jiān)督機器學習技術的結構主題模型包(Structural Topic Model package)對文本主題進行識別,其目的在于深化對于跨時間、跨區(qū)域法律現(xiàn)象的了解。所謂主題模型,是一種把重復出現(xiàn)的文本字樣(text pattern)找出來之后人工標記(tag)主題的研究工具,比如把宅基地、建房、宅基、使用權、使用、居住、村民等詞同時出現(xiàn)的文本手動全都標記為宅基地主題等,一個文本中顯然可以同時含有多個主題。一項以2萬5千多個河南行政訴訟文書為對象的主題模型研究更新了學界既有的對中國行政訴訟的認識,比如集團訴訟和起訴警察不作為等創(chuàng)新性訴訟策略的增加,以行政訴訟為表、以向民事第三人追償為里的“行政訴訟民事化”現(xiàn)象等。另一項拓展到全國范圍行政訴訟的主題模型研究則試圖找出2015年《行政訴訟法》修改前和修改后起訴案件類型的變化,隨著《行政訴訟法》修改后立案標準的降低,新增案件似乎并沒有集中出現(xiàn)在某些特定主題領域,那么到底什么因素導致了案件數(shù)量的增長,以及法院是否在依靠程序裁定來應對辦案數(shù)量的壓力?面對這些懸而未決的問題,李本教授坦陳數(shù)據(jù)更多提供了問題而不是答案,而答案可能更多需要對高透明度法院進行定性研究來獲知。
在評議和提問環(huán)節(jié),程金華教授首先點出,李本教授對中國司法裁判文書的研究并非追趕學術時髦的舉動,而是多年來在河南等省份所做定性研究的自然延伸,因此較之普遍以“威權法治”(Authoritarian Legality)等理論來描述中國的西方學界,有著更強的在場感。程老師同時又指出,李本教授所使用的裁判文書數(shù)據(jù)應該算作大量數(shù)據(jù)而不是大數(shù)據(jù)、包含著結果信息而不是過程信息。在隨后的回答環(huán)節(jié),李本教授謙遜地請教該如何使用如中國裁判文書這樣大量、不全的數(shù)據(jù),程金華教授提議可以先聚焦到一兩個案由進行分析。在觀眾提問環(huán)節(jié)中,聽眾中來自法院的法官對如何使用主題模型非常感興趣,而來自安泰經管學院金融系的年輕老師則提出建設性的學術批評,認為量化研究應從假設而非數(shù)據(jù)出發(fā)。季衛(wèi)東教授最后總結發(fā)言,認為從中國裁判文書網在2014年上線起,中美學者應該是從同一條起跑線上開始做研究,借助著“司法大數(shù)據(jù)與中國審判能力和審判體系現(xiàn)代化”的國家重大社科基金項目和亞行項目,中國的法社會學學者也應當在借助主題模型等技術手段進行司法裁判文書分析上有所斬獲。整場講座中,李本教授以其嫻熟的漢語一一回答了提問,其和善的笑容和隨處的幽默都散發(fā)著學術和人格魅力。講座在全場觀眾的熱烈掌聲中結束。
第六講
“法的學科交叉沙龍”第六講將于9月23日舉行,主題為“人工智能、規(guī)范、大數(shù)據(jù)以及法律”。