【作者】秦裕林、葛巖、林喜芬
【內(nèi)容提要】
秦裕林、葛巖、林喜芬 | 波斯納寫錯了貝葉斯公式嗎?
*秦裕林
上海交通大學(xué)凱原法學(xué)院訪問特聘教授、心理學(xué)博士
葛巖
上海交通大學(xué)人文藝術(shù)研究院教授、藝術(shù)與考古學(xué)博士
林喜芬
上海交通大學(xué)凱原法學(xué)院教授、法學(xué)博士
在決策與判斷研究中,貝葉斯(Bayes)理論起著十分重要的作用,對于法律決策、司法判斷的量化研究,也莫能例外,因為法官判案的過程可以視為在特定的證據(jù)條件下,對被告刑事責(zé)任(是否定罪、如何量刑)、民事責(zé)任(是否歸責(zé)、如何賠償)的判斷和決策過程。在《法官如何思考》一書中,波斯納舉了一個無陪審團且證人是原告本人的關(guān)于性別歧視訴訟案件的例子。他在這個例子中,按照貝葉斯理論分析了法官判別證人是否講真話的過程。這個例子表明貝葉斯理論能夠幫助我們看到,在法官判案的過程中,法官本人的意識是如何起作用的,進而能夠幫助我們?nèi)ヌ接懹心男胺欠l主義的因素”可能潛在地影響著法官的判決(第61~62頁)。
用貝葉斯決策理論的術(shù)語來說,法官的任務(wù)是判斷假設(shè)H(Hypothesis)為真(在本例中是證人講真話)的概率大小,執(zhí)行這個任務(wù)的過程有三個階段:
(一) 形成先驗概率。在證人開始作證以前,有理由相信,法官對這個證人講真話的可能性(概率)的大小,便會有一個估計。影響這一估計的因素非常多,從證人的背景介紹,證人在現(xiàn)場的態(tài)度、情緒,甚至證人宣誓作證時站立的姿勢,到法官本人的經(jīng)驗和素質(zhì),等等,都可能會產(chǎn)生或多或少的影響。其中,很多影響是無意識的。因為這個概率估計發(fā)生在證人作證以前,通常被稱為假設(shè)H(證人講的是真話)為真的先驗概率(prior probability),或者譯為事前概率,記為P(H)。如果用~H表示假設(shè)H為假(證人沒有講真話),因為H和~H兩者必居其一,~H的先驗概率為P(~H)=1-P(H)。
(二) 估計假設(shè)H與證人證言的關(guān)系。如果把證人的證言帶來的信息記為E(Evidence),有了E以后,就需要知道聯(lián)系證據(jù)E與假設(shè)H的兩個條件概率:(1) 在證人講真話(假設(shè)H為真)的條件下,觀察到E的概率,記為P(E|H);(2) 在證人講假話(假設(shè)H為假)的條件下,觀察到E的概率,記為P(E|~H)。很明顯,這兩個概率的估計,也與法官的經(jīng)驗密切相關(guān)。
(三) 計算在有證據(jù)E的條件下,假設(shè)H為真的概率,記為P(H|E)。這是法官的主要考量。由于這個概率是法官在獲得證據(jù)E以后產(chǎn)生的,通常又稱為在有了證據(jù)E的條件下,假設(shè)H為真的后驗概率(posterior probability),或者譯為事后概率。按照貝葉斯定理,在有了(一)和(二)的信息以后,后驗概率P(H|E)為:
P(H|E)=P(E|H)*P(H)/[P(E|H)*P(H)+P(E|~H)P(~H)](1)
用波斯納例子中的數(shù)值將上述過程具體化:(一) 假定一名法官看到這位證人時產(chǎn)生的先驗概率P(H)=0.25,即,在聽取證人證言前,法官相信證人講真話的概率為25%,于是H為假的先驗概率P(~H)=1-P(H)=0.75。(二) 假定知道在證人講真話(假設(shè)H為真)的條件下,觀察到證據(jù)E的條件概率P(E|H)=0.6;在證人講假話(假設(shè)H為假)的條件下,觀察到證據(jù)E的條件概率為P(E|~H)=0.3。[注意,P(E|~H)通常不等于1-P(E|H)。如果P(E|H)=P(E|~H),由(1)可知,P(H|E)=P(H),證據(jù)E將對H是否為真,不提供任何新的信息]。(三) 將這些數(shù)值代入貝葉斯公式(1),可以得到在有證人證言E的條件下,證人講真話的后驗概率P(H|E):
P(H|E)=0.6*0.25/(0.6*0.25+0.3*0.75)=0.4
換言之,在聽了證人的證言后,法官斷定原告,也就是證人,在這個性別歧視訴訟案件中講真話的概率不到50%。以此去看,那位原告兼證人很可能敗訴。
假定審理這個案件的是另一位法官。在見到這位證人時,他認為證人講真話的先驗概率是P(H)=0.67,則P(~H)=1-P(H)=0.33?;蛟S和許多人的直覺判斷相悖,即使他如同上面的那位法官,也認為P(E|H)=0.6,P(E|~H)=0.3,按照貝葉斯公式(1),計算的結(jié)果是:
P(H|E)=0.6*0.67/(0.6*0.67+0.3*0.33)=0.8
即,法官斷定原告,也即是證人,在這個案件中講真話的概率達到80%。以此去看,那位原告兼證人很可能勝訴。
通過這個例子,波斯納試圖說明,基于貝葉斯決策理論,法官的主觀先驗概率不同,可能導(dǎo)致相同案件得到不同,甚至是完全相反的判決。
這里,有一個有趣也有意義的問題:法官的判斷真的是基于貝葉斯決策理論嗎?表面上去看,這不大可能。且不說大多數(shù)法官可能從未聽說過貝葉斯公式,即使知道貝葉斯公式,在判案中,他們也很難去估量出P(H),P(E|H)和P(E|~H)等概率的準(zhǔn)確數(shù)值。那么,貝葉斯決策理論對法律實證研究有何意義?
我們相信,至少有兩方面的意義。一方面,作為一種決策與判斷的理論框架,如上面的例子所顯示的,貝葉斯決策理論把法官的決策過程掰開來,指出了先驗概率和兩個條件概率決定著法官的最終判決。這就為探討司法過程中影響法官判案的非法條主義因素提供了研究進路,尤其是為探討各種可能的直覺和認知偏差(Heuristics and biases)對法官判案的影響提供了考察的方向。另一方面,從更深層的機制上看,認知心理學(xué)的研究表明,人們有外顯的和內(nèi)隱的兩種知識。外顯的知識是人們能夠知道自己所知道的知識,例如3+2=5是我們知道的我們所具有的知識;內(nèi)隱的知識是人們不知道自己知道(或者說不明白)的,但卻能夠從行為中反映出來的知識。例如,有經(jīng)驗的駕駛員很難向新手講明白怎樣才能流暢地駕駛一輛汽車,因為,這些駕駛知識主要是靠不斷練習(xí)形成的內(nèi)隱的知識。雖然在外顯的判斷中,人們經(jīng)常顯示出不符合貝葉斯理論的地方,但是在實際的決策和判斷過程中,人們常會不知不覺地(內(nèi)隱地)遵循貝葉斯決策理論。在這里,認知心理學(xué)的研究結(jié)果與波斯納的觀察——在廣義上“法官都是(遵循)貝葉斯定理的”(第67頁),殊途同歸。
事實上,貝葉斯決策理論還可以用來理解公眾對法律事件的判斷。例如,在不久前發(fā)生,目前尚未有定論(本體意義上的結(jié)論可能永遠無法獲知)的雷洋案件中,究竟雷洋是否嫖娼,究竟警察執(zhí)法程序是否合規(guī),究竟雷洋的死亡是疾病帶來的猝死,還是不當(dāng)暴力執(zhí)法的后果,每當(dāng)警方公布相應(yīng)的消息,都會激發(fā)輿論的激辯。從貝葉斯理論去看,很可能是因為,對于這一系列問題,警方和不同社會群體的先驗概率存在很大差別。因此,與先驗概率密切相關(guān)的后驗概率,即,知道警方通報之后,對上述問題的回答,也會出現(xiàn)差別。最終導(dǎo)致社會輿論在案情判斷中的分歧,乃至嚴(yán)重分裂。
需要指出的是,波斯納在《法官如何思考》(第61頁)中給出的下面這個貝葉斯公式和常見的貝葉斯公式看上去有明顯不同,這可能會給讀者帶來困惑:
Ω(H|E)=[P(E|H)/P(E|~H)]*Ω(H)(2)
按原文的解釋,“Ω是概率”,即,對于假設(shè)H,Ω(H)是H為真的先驗概率,Ω(H|E)是在E出現(xiàn)的條件下,H為真的后驗概率;“P是概率”,P(E|H)/P(E|~H)是(如果H為真時觀察到E的概率)與(如果H為假時觀察到E的概率)的概率之比。據(jù)波斯納說,“這就是最簡版的貝葉斯定理”。然而,它與前面給出的常見的貝葉斯公式(1)看上去很不一樣。而且,如果因為它們都是“概率”,把Ω(H)當(dāng)成P(H),Ω(H|E)當(dāng)成P(H|E),將波斯納給出的貝葉斯公式(2)改寫成P(H|E)=[P(E|H)/P(E|~H)]*P(H),則顯然是錯誤的。
難道波斯納寫錯了貝葉斯公式?
問題在于,雖然書中在此把Ω和P都叫做“概率”,它們卻有各自不同的表述。P的定義遵循常規(guī)的“概率”表達方式,事件A發(fā)生的概率P(A)為:
P(A)=事件A發(fā)生時可能出現(xiàn)的基本情況的數(shù)目/所有事件可能出現(xiàn)的基本情況的數(shù)目
它的分母可以進一步細化為:
所有事件可能出現(xiàn)的基本情況的數(shù)目=事件A發(fā)生時可能出現(xiàn)的基本情況的數(shù)目+事件A不發(fā)生時可能出現(xiàn)的基本情況的數(shù)目
舉個例子來講,在擲骰子游戲中,每擲一次的結(jié)果,從1點到6點,有6種可能的基本情況。假設(shè)每種情況出現(xiàn)的可能性相同,那么擲一次骰子,出現(xiàn)的點數(shù)N小于3的可能性(概率)有多大?通常的回答是P(N<3)=2/6。這里,等式右端的分子2是指事件“點數(shù)N小于3”發(fā)生時可能出現(xiàn)的基本情況的數(shù)目(無論出現(xiàn)1點或者2點,由于它們都小于3,故都屬于這一事件)。分母6則是指擲骰子中所有可能出現(xiàn)的基本情況的數(shù)目。事實上,這里的6等于事件“點數(shù)N小于3”發(fā)生時可能出現(xiàn)的基本情況的數(shù)目,即2(點數(shù)為1,2等兩種情況),加上事件“點數(shù)N小于3”不發(fā)生時可能出現(xiàn)的基本情況的數(shù)目,即4(點數(shù)為3,4,5,6等4種情況)。
與P(A)不同,Ω(A)的定義是:
Ω(A)=事件A發(fā)生時可能出現(xiàn)的基本情況的數(shù)目/事件A不發(fā)生時可能出現(xiàn)的基本情況的數(shù)目
回到上面擲骰子的例子,按Ω(A)的定義有,Ω(N<3)=2/4(或2∶4),這里,等式右端的分子2是指事件“點數(shù)N小于3”發(fā)生時可能出現(xiàn)的基本情況的數(shù)目,等式右端的分母4是指事件“點數(shù)N小于3”不發(fā)生時可能出現(xiàn)的基本情況的數(shù)目。附錄A中我們給出了按照這樣定義的P(A)和Ω(A),等式(1)和(2)相一致的證明。
明白了P(A)與Ω(A)的定義后,如果把上面的第一個法官的例子中的P(H)=0.25=1/4=1/(1+3)換成Ω(H)=1/3,然后與P(E|H)=0.6,P(E|~H)=0.3一起代入(2),可以計算出
Ω(H|E)=(0.6/0.3)*1/3=2/3
再按照P(A)的定義,P(H|E)=2/(2+3)=2/5=0.4,與我們上面提供的結(jié)果相同。這樣,《法官如何思考》中關(guān)于貝葉斯決策理論的例子中的具體計算過程(第62頁)也就比較容易理解了。
這篇短文有兩個目的:(1) 通過介紹波斯納的工作,引起法律實證研究者對貝葉斯決策理論的重視。已經(jīng)有許多研究表明,無論是把貝葉斯決策理論作為理論框架,還是作為人在經(jīng)驗中實際遵循的規(guī)則,都可能導(dǎo)致新的研究進路;(2) 澄清一個可能困擾《法官如何思考》讀者的數(shù)學(xué)問題,因為波斯納把他的貝葉斯公式中的Ω和P都叫做“概率”,卻沒有直接指明它們的定義是不同的,也沒有顯式地給出它們的定義。
附錄
關(guān)于波斯納的貝葉斯公式(2)與常見貝葉斯公式(1)的一致性的證明
記A事件發(fā)生時可能出現(xiàn)的基本情況的數(shù)目為n(A),A事件不發(fā)生時可能出現(xiàn)的基本情況的數(shù)目為n(~A)。按照定義,我們有Ω(A)=n(A)/n(~A);P(A)=n(A)/(n(A)+n(~A))。同時,P(~A)=n(~A)/(n(A)+n(~A))。注意到P(A)與P(~A)的分母相同,于是有
P(A)/P(~A)=n(A)/n(~A)
按定義,等式右邊就是Ω(A)。由此,可將上式改寫為:
Ω(A)=P(A)/P(~A)(3)
按常見貝葉斯公式(1),我們有
P(H|E)=P(E|H)*P(H)/[P(E|H)*P(H)+P(E|~H)*P(~H)](4)
P(~H|E)=P(E|~H)*P(~H)/[P(E|~H)*P(~H)+P(E|H)*P(H)](5)
其中,(5)利用了等式~(~H)=H(相當(dāng)于負負得正)。
將式(3)中的A用H|E代入,并且注意到(4),(5)的分母實際上相同,有
Ω(H|E)=P(H|E)/P(~H|E)=[P(E|H)*P(H)]/[P(E|~H)*P(~H)]
=[P(E|H)/P(E|~H)]*[P(H)/P(~H)]
=[P(E|H)/P(E|~H)]*Ω(H)
這就是公式(2)。最后一步成立是因為Ω(H)=P(H)/P(~H)。
因此,(1)和(2)是一致的。
原文刊載于《交大法學(xué)》2016年第4期