亚洲一线产区二线产区区别在哪,亚洲AV永久无码精品,久久精品国产精品国产精品污,亚洲精品亚洲人成年,青青草视频在线观看综合网,亚洲国产色欲AV一区二区三区在线,亚洲美乳字幕日韩无线码高清专区

當(dāng)前位置:首頁(yè) > 文獻(xiàn)資源 > 論文著作 > 理論推演
林曦 | 人工智能“幻覺(jué)”的存在主義闡釋
2025年05月06日 【作者】林曦 預(yù)覽:

【作者】林曦

【內(nèi)容提要】


人工智能“幻覺(jué)”的存在主義闡釋







林曦 復(fù)旦大學(xué)政治哲學(xué)教授、社會(huì)科學(xué)高等研究院院長(zhǎng)助理








摘要:在文本生成和處理領(lǐng)域,人工智能所生成的文本可能是無(wú)意義、不連貫或者是循環(huán)往復(fù)的。人工智能所生成或處理的文本有可能不忠實(shí)于文本的來(lái)源,這種偏離理想預(yù)期的文本成本被稱為人工智能幻覺(jué)。隨著人工智能應(yīng)用的不斷拓展,人工智能幻覺(jué)成為一個(gè)亟待探討和解決的問(wèn)題。在計(jì)算機(jī)科學(xué)領(lǐng)域中,幻覺(jué)主要是由輸出內(nèi)容和源內(nèi)容之間的映射關(guān)系的扭曲或者破壞而產(chǎn)生,這其實(shí)與薩特的存在主義框架存在同構(gòu)性。薩特的存在主義在顯象和本體之間構(gòu)建了一種映射關(guān)系,而這種映射關(guān)系是從存在主義的角度來(lái)討論幻覺(jué)的產(chǎn)生機(jī)制。這一框架為我們探討人工智能的幻覺(jué)問(wèn)題提供了一個(gè)闡釋學(xué)的工具和手段,可以用來(lái)檢視人工智能幻覺(jué)的產(chǎn)生機(jī)制及其相應(yīng)的倫理風(fēng)險(xiǎn)。






薩特曾經(jīng)從存在主義的視角論述過(guò)幻覺(jué)問(wèn)題。在薩特看來(lái),存在物及其顯象之間的關(guān)系涉及我們對(duì)幻覺(jué)的定義和看法。如果我們相信這個(gè)世界只有物自體或者存在物本身才是真實(shí)的,而且這種真實(shí)性具有排他性和唯一性,那么作為揭露存在物存在的顯象本身就變成了被這種排他性的真實(shí)否定的對(duì)象。換言之,顯象就成了某種純粹否定的客體,它因?yàn)闊o(wú)法滿足真實(shí)性=物自體/存在物這樣一個(gè)方程式而淪落為被真實(shí)性排斥在外的某種否定性之客體,從而無(wú)法獲得按照這個(gè)方程式或者標(biāo)準(zhǔn)而取得的真實(shí)性,顯象變成了非存在物的對(duì)象或者客體,它的存在本身就是一種幻覺(jué)。薩特的存在主義觀點(diǎn)其實(shí)是在顯象和本體之間構(gòu)建了一種映射關(guān)系,這種映射關(guān)系是從本體論的角度來(lái)討論幻覺(jué)的產(chǎn)生和變化的。薩特在探索存在與顯象的關(guān)系時(shí),認(rèn)為我們遇到了一個(gè)關(guān)鍵的區(qū)別——表象的概念并不僅僅是一個(gè)掩蓋某些隱藏的終極現(xiàn)實(shí)的門(mén)面,因?yàn)楸硐蟊旧硪膊皇悄硞€(gè)真實(shí)存在的不可靠或不穩(wěn)定的表現(xiàn)。如果我們認(rèn)為,本質(zhì)存在的概念占據(jù)了主導(dǎo)地位,那么顯象就會(huì)被貶低為純粹的消極概念,進(jìn)而與真實(shí)的存在相對(duì)起來(lái)。換言之,顯象此時(shí)就變成了非存在。這樣的一種貶低意味著顯象與存在之間失去了維系其穩(wěn)定關(guān)聯(lián)的聯(lián)系,這種聯(lián)系就是一種映射關(guān)系,即顯象是存在在現(xiàn)象層面上的一種投射,如果失去了這種映射關(guān)系,那么表象就會(huì)被貶低或者否定了,會(huì)讓表象淪為純粹的幻覺(jué)和錯(cuò)誤。因此,在薩特看來(lái),最緊迫的挑戰(zhàn)不再是如何保持表象的凝聚力,防止其崩潰回?zé)o形的非現(xiàn)象的虛空,而是如何重新定義存在與表象之間的關(guān)系。我們必須超越本質(zhì)與表象的模型,認(rèn)識(shí)到表象與存在之間相互勾連的方式。正是在表象的領(lǐng)域,即存在者向世界的整體呈現(xiàn)中,我們才得以感知其存在——它并非隱藏真相的微不足道的反映,而是存在形成和獲得意義的真正方式。所以,在薩特的存在主義框架之中,顯象并不只是存在的簡(jiǎn)單的表現(xiàn),而本身也是一種積極性,它并不是存在的附屬品;恰恰相反,顯象本身也體現(xiàn)了自身的一種絕對(duì)性,是其自身的絕對(duì)的表達(dá)。顯象與存在物都表達(dá)了一種積極性,而真實(shí)與否的評(píng)價(jià)是可以同時(shí)適用于這兩者的,尤其是二者之間的映射關(guān)系。如果我們割裂了這種映射關(guān)系或者該關(guān)系遭到了破壞,那么幻覺(jué)和錯(cuò)誤就會(huì)產(chǎn)生。薩特所討論的這種存在論角度的幻覺(jué)產(chǎn)生機(jī)制,有助于我們理解人工智能所產(chǎn)生的幻覺(jué),本文試圖從這種存在主義的角度來(lái)探討人工智能的幻覺(jué)問(wèn)題。為此,我們將首先對(duì)計(jì)算機(jī)科學(xué)領(lǐng)域的幻覺(jué)進(jìn)行一個(gè)定義,然后通過(guò)薩特的存在主義框架對(duì)其進(jìn)行分析。



一、計(jì)算機(jī)科學(xué)領(lǐng)域中的幻覺(jué)

“幻覺(jué)是一個(gè)神經(jīng)科學(xué)和心理學(xué)的概念,本意是指感覺(jué)接受器對(duì)客觀經(jīng)驗(yàn)不準(zhǔn)確的主觀再現(xiàn)。從臨床的角度來(lái)看,幻覺(jué)發(fā)生的條件是不同程度的感覺(jué)接受功能被排除在意識(shí)范圍之外,這種排斥通常具有病理學(xué)的基礎(chǔ),即在人的大腦區(qū)域內(nèi),感覺(jué)器官和大腦皮層感覺(jué)感受區(qū)之間某個(gè)地方的感覺(jué)神經(jīng)通路可能存在損傷,或者大腦皮層感覺(jué)感受區(qū)受到一定程度的損傷,除此之外,聽(tīng)覺(jué)、味覺(jué)、視覺(jué)等感官接受器、神經(jīng)以及相關(guān)方面的疾病也會(huì)引起相應(yīng)身體感官的幻覺(jué)。幻覺(jué)可能會(huì)具有兩種形態(tài),一種是簡(jiǎn)單幻覺(jué),另外一種是復(fù)雜幻覺(jué)。前者指的是人的身體中感覺(jué)感受器或感覺(jué)神經(jīng)受傷或者大腦皮層的感覺(jué)感受區(qū)受到輕微損傷而導(dǎo)致的幻覺(jué),該幻覺(jué)主要是由受傷的單一感覺(jué)組成的。相比之下,如果大腦感覺(jué)感受區(qū)遭受了大面積的損傷,則可能會(huì)出現(xiàn)由多種甚至所有感覺(jué)模式的記憶組成的幻覺(jué),這種現(xiàn)象被稱為復(fù)雜或者復(fù)合幻覺(jué)。


“幻覺(jué)一詞在計(jì)算機(jī)科學(xué)領(lǐng)域中的應(yīng)用,最早可以追溯到貝克和金出武雄在其計(jì)算機(jī)視覺(jué)研究中提出的算法。在計(jì)算機(jī)視覺(jué)和圖像處理領(lǐng)域內(nèi),貝克和金出武雄提出了一種針對(duì)圖像處理的幻覺(jué)算法,旨在增強(qiáng)監(jiān)控圖像中人臉識(shí)別的分辨率,即便原始圖像的分辨率比較低,也同樣可以通過(guò)這個(gè)算法提高分辨率,從而避免額外復(fù)雜性。同時(shí),哪怕是將采樣圖像加入不同標(biāo)準(zhǔn)差的高斯噪聲,該幻覺(jué)算法對(duì)此類噪聲也具有相當(dāng)?shù)聂敯粜?。針?duì)多圖像,如果原始圖像以子像素為單位進(jìn)行多次隨機(jī)平移,在此基礎(chǔ)上形成一系列的輸入圖像,那么可以在使用標(biāo)準(zhǔn)參數(shù)運(yùn)動(dòng)算法對(duì)輸入圖像進(jìn)行對(duì)齊之后再應(yīng)用幻覺(jué)算法,同樣可以達(dá)到對(duì)圖像質(zhì)量進(jìn)行增強(qiáng)的結(jié)果。后來(lái),這一算法還應(yīng)用到了圖像內(nèi)繪以及圖像合成上。所以,在計(jì)算機(jī)視覺(jué)領(lǐng)域,幻覺(jué)指的是一種特定的圖像增強(qiáng)算法,一般是從積極和正面的角度來(lái)加以使用。


近年來(lái),有研究者開(kāi)始從負(fù)面的意義上來(lái)使用幻覺(jué)這一詞語(yǔ)。圖像描述模型可能會(huì)直接幻化出實(shí)際上不在圖像場(chǎng)景中的物體,被稱為對(duì)象幻覺(jué),即人工智能根據(jù)外界所輸入的圖像來(lái)直接生成一個(gè)作為文本輸出的句子描述,而這個(gè)文本輸出的句子描述中包含了該圖像所沒(méi)有囊括的一個(gè)客體或者對(duì)象。之所以會(huì)產(chǎn)生這種對(duì)象幻覺(jué),可能原因就在于人工智能在視覺(jué)處理過(guò)程所產(chǎn)生的分類錯(cuò)誤,以及在文本輸出過(guò)程之中人工智能過(guò)度依賴語(yǔ)言先驗(yàn)而導(dǎo)致的輸出與源圖像產(chǎn)生脫節(jié)。現(xiàn)在的人工智能大都依賴大語(yǔ)言模型,依靠海量的語(yǔ)言數(shù)據(jù)來(lái)進(jìn)行機(jī)器學(xué)習(xí)和模型訓(xùn)練,可能導(dǎo)致人工智能按照單詞出現(xiàn)前后順序的統(tǒng)計(jì)學(xué)結(jié)果,去記憶哪些單詞更有可能扎堆出現(xiàn)。通過(guò)這種強(qiáng)統(tǒng)計(jì)關(guān)聯(lián)來(lái)進(jìn)行文本的輸出也會(huì)使輸出的內(nèi)容與源圖像弱關(guān)聯(lián)甚至無(wú)關(guān)聯(lián),這就是由于人工智能過(guò)度依賴事先輸入的語(yǔ)言數(shù)據(jù)而產(chǎn)生的語(yǔ)言一致性錯(cuò)誤,即圖像描述模型所產(chǎn)生的錯(cuò)誤,與僅基于先前生成的單詞進(jìn)行預(yù)測(cè)的大語(yǔ)言模型所產(chǎn)生的錯(cuò)誤,這兩種錯(cuò)誤之間存在一致性。這種一致性在對(duì)圖像描述模型進(jìn)行訓(xùn)練的初期階段表現(xiàn)得尤為明顯,圖像描述模型的錯(cuò)誤與大語(yǔ)言模型的錯(cuò)誤保持了較高的一致性。這說(shuō)明圖像描述模型先要通過(guò)機(jī)器學(xué)習(xí)和數(shù)據(jù)訓(xùn)練,學(xué)會(huì)用流暢的自然語(yǔ)言來(lái)生成文本進(jìn)行文本輸出,在此基礎(chǔ)上才能一步步去整合視覺(jué)信息,將視覺(jué)信息轉(zhuǎn)化為自然語(yǔ)言的輸出文本。相似地,在圖像的對(duì)象檢測(cè)中,同樣會(huì)出現(xiàn)幻覺(jué)現(xiàn)象。在計(jì)算機(jī)視覺(jué)領(lǐng)域,圖像的分析和處理會(huì)涉及對(duì)圖像中的各種物品和對(duì)象進(jìn)行自動(dòng)定位和檢測(cè),如果人工智能在文本輸出的過(guò)程中,對(duì)不存在于源圖像之中的物品進(jìn)行了檢測(cè)和描述,那么就會(huì)被稱為幻覺(jué),即人工智能檢測(cè)到了不存在于圖像之中的物品或者對(duì)象。


這樣一種從負(fù)面意義上來(lái)探討計(jì)算機(jī)視覺(jué)研究領(lǐng)域之中的幻覺(jué)的角度,為研究者討論人工智能的幻覺(jué)問(wèn)題提供了思路。在人工智能的自然語(yǔ)言生成領(lǐng)域,大家所討論的幻覺(jué),其實(shí)也是人工智能會(huì)出現(xiàn)的一種錯(cuò)誤。有研究者在2023816日對(duì)ChatGPT3.5進(jìn)行查詢時(shí),ChatGPT對(duì)人工智能幻覺(jué)給出了一個(gè)定義,認(rèn)為其是生成的內(nèi)容并非基于真實(shí)或現(xiàn)有數(shù)據(jù),而是由機(jī)器學(xué)習(xí)模型對(duì)其訓(xùn)練數(shù)據(jù)進(jìn)行推斷或創(chuàng)造性解釋而產(chǎn)生的。這些幻覺(jué)的表現(xiàn)形式多種多樣,如圖像、文本、聲音甚至視頻。當(dāng)機(jī)器學(xué)習(xí)模型,尤其是生成模型等深度學(xué)習(xí)模型,試圖生成超出其從訓(xùn)練數(shù)據(jù)中學(xué)到的內(nèi)容時(shí),就會(huì)產(chǎn)生人工智能幻覺(jué)。這些模型從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)模式和相關(guān)性,并試圖根據(jù)這些模式生成新的內(nèi)容。然而,在某些情況下,它們生成的內(nèi)容看似合理,但實(shí)際上是各種學(xué)習(xí)元素的混合體,導(dǎo)致生成的內(nèi)容可能沒(méi)有意義,甚至可能是超現(xiàn)實(shí)的、夢(mèng)幻的或奇幻的。由ChatGPT自己給出的關(guān)于人工智能幻覺(jué)的定義是有意義的,它基本上概括了在人工智能領(lǐng)域,幻覺(jué)作為一個(gè)問(wèn)題所包含的內(nèi)容、表現(xiàn)形式以及形成原因。在這個(gè)ChatGPT的回答中,幻覺(jué)主要體現(xiàn)為人工智能所生成的輸出內(nèi)容,并不是根據(jù)真實(shí)或者現(xiàn)有的數(shù)據(jù)來(lái)進(jìn)行的,而是因?yàn)槿斯ぶ悄艿哪P突蛘咚惴ㄔ跈C(jī)器學(xué)習(xí)的過(guò)程中,對(duì)所提供的用于預(yù)訓(xùn)練的大型語(yǔ)料庫(kù)進(jìn)行分析處理,包括編碼、解碼、機(jī)器解釋、推斷和輸出等步驟,最終形成的輸出文本與真實(shí)數(shù)據(jù)或者現(xiàn)有數(shù)據(jù)不一致,從而導(dǎo)致了幻覺(jué)


從上文的定義可以看出,在計(jì)算機(jī)科學(xué)領(lǐng)域中,幻覺(jué)主要針對(duì)的是由輸出內(nèi)容和源內(nèi)容(輸入內(nèi)容)之間的映射關(guān)系的扭曲或者破壞而產(chǎn)生,這其實(shí)與薩特的存在主義框架存在同構(gòu)性,二者都是討論在何種機(jī)制上幻覺(jué)或者錯(cuò)誤會(huì)產(chǎn)生。這一點(diǎn)在計(jì)算精神病學(xué)這一學(xué)科領(lǐng)域之中也有所體現(xiàn)。作為計(jì)算科學(xué)和精神病學(xué)交叉的一個(gè)學(xué)科,計(jì)算精神病學(xué)是從計(jì)算的角度來(lái)對(duì)認(rèn)知和行為進(jìn)行解釋,這通常會(huì)涉及計(jì)算過(guò)程中的算法模型,將輸入和輸出進(jìn)行匹配,考察二者之間的映射關(guān)系,亦即薩特存在主義框架所強(qiáng)調(diào)的這種映射關(guān)系。計(jì)算精神病學(xué)主要是針對(duì)認(rèn)知和行為進(jìn)行一個(gè)形式化的解釋和分析,期望能夠在精神病理學(xué)層面上對(duì)行為和認(rèn)知進(jìn)行預(yù)測(cè)和控制。這種形式化分析的著眼點(diǎn)主要在于輸入和輸出之間的映射關(guān)系,這體現(xiàn)了認(rèn)知和行為的心理能力。根據(jù)這種觀點(diǎn),認(rèn)知和行為首先依賴于按照特定結(jié)構(gòu)而得以輸入的初始信息,這些初始信息以各種各樣的數(shù)據(jù)形式得以體現(xiàn),比如感官知覺(jué)信息或者大數(shù)據(jù),經(jīng)過(guò)處于中間環(huán)節(jié)的算法的處理,這些輸入就能夠轉(zhuǎn)化為特定形式的結(jié)果輸出。算法就是針對(duì)某種特定任務(wù)或者問(wèn)題而形成的解決方案的方程式,它描述了認(rèn)知或者行為在應(yīng)對(duì)特定的任務(wù)或問(wèn)題的過(guò)程中所具備的推理和運(yùn)算能力,一般表現(xiàn)為特定推理步驟按照一定邏輯順序進(jìn)行排列組合而得到的方程式。通過(guò)對(duì)輸入和輸出之間的映射關(guān)系進(jìn)行解釋和分析,計(jì)算精神病學(xué)旨在為我們揭示認(rèn)知和行為背后可能存在的機(jī)械計(jì)算過(guò)程和原理。相應(yīng)地,在計(jì)算精神病學(xué)視野下的精神疾病癥狀則是由計(jì)算過(guò)程、算法模型或者輸入輸出信息錯(cuò)誤等因素而導(dǎo)致的特定精神病理學(xué)現(xiàn)象。無(wú)獨(dú)有偶,德勒茲和瓜塔里曾經(jīng)提出過(guò)唯物主義精神病學(xué)的理論論述,對(duì)我們理解人工智能幻覺(jué)也有所啟發(fā)。在德勒茲和瓜塔里看來(lái),首先存在一個(gè)真正的唯物主義和一個(gè)虛假的唯物主義,后者同各種唯心主義的典型形式沒(méi)有很大的區(qū)別。德勒茲和瓜塔里之所以認(rèn)為虛假的唯物主義和典型形式的唯心主義有共同之處,是因?yàn)槎叨济撾x了產(chǎn)生這種思想形式的物質(zhì)現(xiàn)實(shí),變成了一種唯心論的形而上學(xué)形式。這種形式的唯物主義雖然表面上以具體事物為基礎(chǔ),但最終屈服于抽象的誘惑,成為一個(gè)脫離構(gòu)成物質(zhì)世界的各種力量動(dòng)態(tài)相互作用的無(wú)實(shí)體和形而上的體系。這會(huì)導(dǎo)致我們脫離經(jīng)驗(yàn)觀察而追求普遍和先驗(yàn)的知識(shí),從而陷入超驗(yàn)的幻象。在德勒茲和瓜塔里看來(lái),虛假唯物主義在追求固定范疇和決定論法則的過(guò)程中,忽視了偶然性、獨(dú)特性和物質(zhì)現(xiàn)實(shí)不斷變化等因素。這種與物質(zhì)現(xiàn)實(shí)的分離使得虛假唯物主義與傳統(tǒng)唯心主義難以區(qū)分。二者都以各自的方式構(gòu)建了一個(gè)由抽象概念和無(wú)形思想組成的領(lǐng)域,這些概念和思想只會(huì)模糊而非清晰地闡明具體的經(jīng)驗(yàn)世界。此處關(guān)于虛假唯物主義的論述,正好可以啟發(fā)我們對(duì)人工智能幻覺(jué)現(xiàn)象進(jìn)行相應(yīng)的分析。正如虛假唯物主義構(gòu)建了一個(gè)扭曲的物質(zhì)世界圖像,人工智能也是如此,它依賴于抽象的模型和算法,產(chǎn)生的輸出結(jié)果都會(huì)導(dǎo)致幻覺(jué)。我們之所以認(rèn)為這些幻覺(jué)與人類的幻覺(jué)非常相似,是因?yàn)槎叨荚从谳敵鼋Y(jié)果與它所聲稱代表的外部世界之間的分離。就人工智能而言,這種分離源于訓(xùn)練數(shù)據(jù)的局限性、算法固有的偏差以及計(jì)算系統(tǒng)難以真正捕捉真實(shí)世界的全部復(fù)雜性。因此,薩特的存在主義框架、計(jì)算精神病學(xué)的相關(guān)假設(shè),以及德勒茲和瓜塔里的唯物主義精神病學(xué)理論框架,為我們提供了一些闡釋性的工具,用以分析人工智能領(lǐng)域產(chǎn)生幻覺(jué)的機(jī)制與相關(guān)原理。



二、人工智能幻覺(jué)的定義

正如我們?cè)谏衔目吹降?,人工智能在文本生成和處理領(lǐng)域,可能會(huì)存在輸出時(shí)人工智能所生成的文本可能是無(wú)意義、不連貫或者循環(huán)重復(fù)的內(nèi)容。人工智能所生成或處理的文本,有可能不忠實(shí)于文本的來(lái)源,這種偏離理想預(yù)期的文本成本被稱為幻覺(jué)。劉澤垣等學(xué)者將人工智能大模型通過(guò)自然語(yǔ)言指令而生成的任務(wù)分為開(kāi)放式和非開(kāi)放式,前者指的是輸入內(nèi)容不完整并且輸出語(yǔ)義并沒(méi)有包含在輸入內(nèi)容之中的任務(wù)類型,而后者指的是大模型根據(jù)輸入內(nèi)容來(lái)生成文本。對(duì)于這兩種任務(wù)類型,人工智能大模型都有可能會(huì)產(chǎn)生生成內(nèi)容不符合真實(shí)世界的知識(shí)或者生成內(nèi)容與輸入信息不一致的問(wèn)題,即是人工智能幻覺(jué)。在深度神經(jīng)網(wǎng)絡(luò)模型中,人工智能如果是接受大量的數(shù)據(jù)或者文本輸入來(lái)進(jìn)行機(jī)器學(xué)習(xí)和模型訓(xùn)練,并在此基礎(chǔ)上進(jìn)行文本輸出的話,那么在訓(xùn)練過(guò)程中,算法會(huì)收集大量并行數(shù)據(jù),有可能會(huì)使用啟發(fā)式規(guī)則,比如基于卷積神經(jīng)網(wǎng)絡(luò)的主題條件神經(jīng)模型,可以捕捉文檔中單詞之間的依賴關(guān)系,從而實(shí)現(xiàn)文檔級(jí)推理、抽象和釋義。但是,這些啟發(fā)式規(guī)則也有可能會(huì)給數(shù)據(jù)帶來(lái)噪音,這些噪音表現(xiàn)為在輸出中出現(xiàn)與輸入不匹配的短語(yǔ),而這些短語(yǔ)的生成無(wú)法通過(guò)輸入源來(lái)進(jìn)行解釋。神經(jīng)文本生成模型在捕捉到這些噪音的同時(shí),會(huì)生成流暢但無(wú)據(jù)可循的文本,導(dǎo)致人工智能幻覺(jué),即所生成的內(nèi)容不忠實(shí)于輸入源或者內(nèi)容本身毫無(wú)意義。有學(xué)者將幻覺(jué)分為兩類:外在幻覺(jué)與內(nèi)在幻覺(jué)。外在幻覺(jué)指代的是模型所生成的表述,引入了全新的文本內(nèi)容,這些內(nèi)容無(wú)法從源內(nèi)容中得到驗(yàn)證,這種幻覺(jué)的核心要義是往輸出結(jié)果里面添加了無(wú)法在源內(nèi)容里面得到驗(yàn)證的新文本信息。即便在該表述里可能有部分內(nèi)容是忠實(shí)于源內(nèi)容的,但是在輸出的過(guò)程中,只要該模型添加了一些新的文本且這些文本無(wú)法在源內(nèi)容的知識(shí)庫(kù)里得到驗(yàn)證,那么這都會(huì)導(dǎo)致幻覺(jué)。內(nèi)在幻覺(jué)則是錯(cuò)誤地使用了源內(nèi)容知識(shí)庫(kù)里面的主語(yǔ)和賓語(yǔ),導(dǎo)致二者的關(guān)系與源內(nèi)容里面的信息產(chǎn)生矛盾,比如,文本輸出顯示,張藝謀導(dǎo)演了《泰坦尼克號(hào)》電影,這里面的主語(yǔ)是張藝謀,賓語(yǔ)是《泰坦尼克號(hào)》電影,謂語(yǔ)是導(dǎo)演,在源內(nèi)容里面,《泰坦尼克號(hào)》電影的導(dǎo)演是美國(guó)人詹姆斯·卡梅隆,于是文本輸出與源內(nèi)容直接產(chǎn)生了矛盾,這就是內(nèi)在幻覺(jué),其要義是人工智能模型誤用了相關(guān)信息,導(dǎo)致輸出和輸入之間產(chǎn)生了矛盾和錯(cuò)配。


在人工智能領(lǐng)域中,與幻覺(jué)相對(duì)應(yīng)的詞語(yǔ)包括事實(shí)性忠實(shí)性。事實(shí)性指的是基于事實(shí)的某種知識(shí)或者陳述,而忠實(shí)性指的是輸出文本忠實(shí)于源輸入內(nèi)容。〔10〕通過(guò)這樣的區(qū)分,我們可以理解人工智能幻覺(jué)會(huì)在什么樣的情況下產(chǎn)生,機(jī)器所生成的輸出文本可能與真實(shí)世界的知識(shí)產(chǎn)生了矛盾。在自然語(yǔ)言生成的過(guò)程中,有學(xué)者歸納了幻覺(jué)產(chǎn)生的原因大致分為兩種:一種是源于數(shù)據(jù),另一種是源自訓(xùn)練和推理過(guò)程產(chǎn)生的幻覺(jué)。首先,在數(shù)據(jù)方面,造成數(shù)據(jù)幻覺(jué)的原因可能是參照之間的差異,即源內(nèi)容和目標(biāo)參照之間產(chǎn)生了差異,這種差異有可能是由啟發(fā)式數(shù)據(jù)收集造成的。如果數(shù)據(jù)集里面包含了這種發(fā)散或者差異,一旦用該數(shù)據(jù)集來(lái)訓(xùn)練大語(yǔ)言模型,那么在自然語(yǔ)言生成的過(guò)程中就可能會(huì)出現(xiàn)輸出文本不忠實(shí)于源輸入內(nèi)容的情形。從定義的角度來(lái)看,啟發(fā)式數(shù)據(jù)收集指的是在收集大規(guī)模數(shù)據(jù)集時(shí),大語(yǔ)言模型會(huì)啟發(fā)式地選擇真實(shí)表述或表格并將之匹配為源或者目標(biāo)。在這個(gè)過(guò)程中,目標(biāo)參考值就有可能包含一些新的信息,而這些信息無(wú)法在源內(nèi)容里得到驗(yàn)證,由此我們得到一個(gè)不忠實(shí)于源內(nèi)容的目標(biāo)參考值。比如,如果我們讓人工智能從一些結(jié)構(gòu)化數(shù)據(jù)格式(如數(shù)據(jù)庫(kù)記錄、知識(shí)圖譜和表格等)中讀取數(shù)據(jù)并自動(dòng)生成描述性的自然語(yǔ)言文本,那么人工智能的條件語(yǔ)言模型則可能會(huì)生成無(wú)條件的隨機(jī)事實(shí),這種不可控的隨機(jī)性就直接導(dǎo)致了事實(shí)幻覺(jué),影響了數(shù)據(jù)的真實(shí)性。而且,數(shù)據(jù)集中的重復(fù)信息有可能沒(méi)有被過(guò)濾掉,如果用于大語(yǔ)言模型的預(yù)訓(xùn)練語(yǔ)料庫(kù)里面包含了一些重復(fù)示例,人工智能在學(xué)習(xí)的過(guò)程中記住這些重復(fù)示例,有可能會(huì)因?yàn)槠涑霈F(xiàn)得高頻而導(dǎo)致人工智能傾向按照這些重復(fù)示例來(lái)生成短語(yǔ),如此一來(lái),針對(duì)每個(gè)具體的源內(nèi)容,大語(yǔ)言模型在文本輸出的過(guò)程中就容易產(chǎn)生偏離了忠實(shí)性的幻覺(jué)問(wèn)題。


在涉及數(shù)據(jù)集時(shí),另外一個(gè)重要的考量因素就是對(duì)幻覺(jué)的容忍程度,因?yàn)榇笳Z(yǔ)言模型所輸出的內(nèi)容,也會(huì)根據(jù)任務(wù)的不同而對(duì)事實(shí)性和忠實(shí)性有不同的要求,常見(jiàn)的任務(wù)類型包括摘要概括、從數(shù)據(jù)到文本以及對(duì)話式交流。摘要概括即要求人工智能可以將篇幅較長(zhǎng)的文本凝練成篇幅較短的文本,從數(shù)據(jù)到文本則是要求機(jī)器能夠針對(duì)不同的源內(nèi)容格式輸出為文本,而對(duì)話式交流則是強(qiáng)調(diào)生成輸出的多樣性。這幾種不同的任務(wù)類型,對(duì)幻覺(jué)的容忍程度也不一樣。在摘要概括領(lǐng)域,忠實(shí)性的要求比較高,源內(nèi)容是輸入的文本,需要機(jī)器來(lái)進(jìn)行概括和提煉,此時(shí)使用者會(huì)對(duì)人工智能的內(nèi)在幻覺(jué)(輸出誤用了源內(nèi)容從而導(dǎo)致和源內(nèi)容相矛盾)容忍程度比較低,會(huì)期待輸出的文本能夠較高地忠實(shí)于所輸入的源內(nèi)容,盡管此時(shí)機(jī)器可能并不特別地對(duì)輸出和輸入的內(nèi)容進(jìn)行真實(shí)性的考察。這種忠實(shí)性是衡量人工智能是否完成了摘要概括任務(wù)的核心標(biāo)準(zhǔn)。在數(shù)據(jù)到文本的任務(wù)模式中,源內(nèi)容是非語(yǔ)言或者文本的數(shù)據(jù),比如圖片、表格、視頻等,而人工智能面臨的任務(wù)是從源內(nèi)容中生成描述性文本。如果我們采用端到端的方式,使用編碼器解碼器架構(gòu)進(jìn)行人工智能訓(xùn)練,那么人工智能所生成的文本真實(shí)性就會(huì)程度低且覆蓋范圍小。此時(shí),可能產(chǎn)生人工智能幻覺(jué)的地方在于人工智能所輸出的參考文本可能會(huì)包含表格中沒(méi)有的額外信息,或者由于人工智能在收集數(shù)據(jù)集的過(guò)程中所遇到的噪音,它會(huì)遺漏表格中的重要信息。相比之下,在對(duì)話式交流中使用者對(duì)事實(shí)性和忠實(shí)性的要求都不高。有時(shí)使用者可能會(huì)采用閑聊、主觀對(duì)話或者用戶輸入的方式來(lái)提供一些內(nèi)容,這些內(nèi)容不一定能夠在人類共有的歷史記錄或者知識(shí)庫(kù)之中找到對(duì)應(yīng)的事實(shí)根據(jù)。在這種情況下,使用者對(duì)人工智能產(chǎn)生幻覺(jué)的容忍度就比較高,因?yàn)閷?duì)話式交流任務(wù)模式的核心是促成使用者和人工智能之間對(duì)話的進(jìn)行,保證對(duì)話生成的參與度和多樣性。此時(shí)人工智能很有可能就會(huì)產(chǎn)生各種外在幻覺(jué),即輸出的文本包含了許多無(wú)法在源內(nèi)容里面得到驗(yàn)證和對(duì)應(yīng)的信息。



三、人工智能幻覺(jué)的產(chǎn)生因素

人工智能幻覺(jué)也有可能是在人工智能訓(xùn)練和建模選擇的過(guò)程之中產(chǎn)生。人工智能在訓(xùn)練的時(shí)候一般都會(huì)用到編碼器,該編碼器的作用就是將輸入的文本處理成機(jī)器可以理解的內(nèi)容并編碼為有意義的表征。如果編碼器的理解能力有缺陷,那么就會(huì)導(dǎo)致幻覺(jué)。在面對(duì)提供給機(jī)器進(jìn)行預(yù)訓(xùn)練的數(shù)據(jù)集時(shí),如果編碼器在這些數(shù)據(jù)集之中理解有誤,學(xué)習(xí)到錯(cuò)誤的相關(guān)性,那么很大概率在文本輸出的過(guò)程中,會(huì)出現(xiàn)幻覺(jué),導(dǎo)致輸出內(nèi)容和源內(nèi)容之間產(chǎn)生差異。在神經(jīng)機(jī)器翻譯中,很多都會(huì)采用編碼器解碼器的框架。在這個(gè)二元的框架中,編碼器和解碼器執(zhí)行不同的功能,編碼器會(huì)將源內(nèi)容投射到一個(gè)公共概念空間中的相關(guān)表征之中,而解碼器則從這些表征中檢索到相關(guān)信息,然后逐一將其解碼為目標(biāo)翻譯內(nèi)容。編碼器將輸入的數(shù)據(jù)、文本和內(nèi)容進(jìn)行編碼,下一步就是將這些編碼的內(nèi)容傳輸給解碼器,由解碼器進(jìn)行加工處理,生成最終的目標(biāo)輸出。如果編碼器的編碼有誤,那么傳輸給解碼器后,大概率解碼器也會(huì)生成錯(cuò)誤的輸出內(nèi)容。這樣的一種編碼解碼錯(cuò)誤聯(lián)結(jié)可能會(huì)導(dǎo)致在生成的內(nèi)容之中事實(shí)性和忠實(shí)性都受損。即便編碼的方式無(wú)誤,解碼所采用的算法和策略也有可能會(huì)導(dǎo)致幻覺(jué),如果解碼的算法和策略是提高生成和輸出結(jié)果的多樣性,那么就可能導(dǎo)致在輸出結(jié)果中幻覺(jué)產(chǎn)生的可能性大大提高,所以很多時(shí)候輸出結(jié)果的多樣性以及解碼器能夠保證輸出和輸入之間高度匹配的真實(shí)性,這是一個(gè)兩難的問(wèn)題,因?yàn)槿绻獯a的策略是增加隨機(jī)性,那么在生成輸出結(jié)果時(shí),人工智能會(huì)增加一些不包含在源內(nèi)容里面的信息,更可能生成包含幻覺(jué)的內(nèi)容。


在生成輸出的過(guò)程中,如果解碼策略沒(méi)有問(wèn)題,仍然會(huì)存在一個(gè)暴露偏差的問(wèn)題,這同樣會(huì)導(dǎo)致幻覺(jué)。一般在序列到序列的模型訓(xùn)練中,會(huì)用到教師強(qiáng)制最大似然估計(jì)訓(xùn)練方法,即在每個(gè)訓(xùn)練的時(shí)間步之內(nèi),所有的輸入都來(lái)自真實(shí)樣本,這些真實(shí)的樣本都來(lái)自真實(shí)的歷史數(shù)據(jù)而不是模型的預(yù)測(cè)。如此一來(lái),模型就可以更快地收斂,讓訓(xùn)練過(guò)程更加穩(wěn)定,但是從訓(xùn)練切換到預(yù)測(cè)或者應(yīng)用的過(guò)程時(shí),模型在文本輸出時(shí)不會(huì)去訪問(wèn)真實(shí)的歷史數(shù)據(jù)或者世界知識(shí),而更多地依賴自己的預(yù)測(cè),按照自己先前生成的歷史序列生成下一個(gè)標(biāo)記樣本來(lái)進(jìn)行預(yù)測(cè),但是當(dāng)進(jìn)行推理或者應(yīng)用時(shí),每一個(gè)時(shí)間步的輸入就變成了模型自己在上一個(gè)時(shí)間步的輸出,這就是二者在解碼過(guò)程中在時(shí)間步上面的差異,這兩個(gè)過(guò)程的不一致會(huì)導(dǎo)致誤差累積,即前面的單元如果輸入有誤,那么這個(gè)錯(cuò)誤的輸入會(huì)影響下一個(gè)單元的輸出,而下一個(gè)單元繼續(xù)作為輸入會(huì)影響下下個(gè)單元的輸出,如此循環(huán)往復(fù)會(huì)導(dǎo)致錯(cuò)誤累積,尤其是當(dāng)目標(biāo)序列變長(zhǎng)的時(shí)候。這種差異被稱為暴露偏差,其特點(diǎn)是目標(biāo)序列的長(zhǎng)度和幻覺(jué)出現(xiàn)的幾率呈正相關(guān)。


除了暴露偏差,在參數(shù)知識(shí)方面的偏差也可能導(dǎo)致幻覺(jué)。所謂的參數(shù)知識(shí)即提供給人工智能模型進(jìn)行預(yù)訓(xùn)練的大型語(yǔ)料庫(kù)所具備的一些參數(shù),這些參數(shù)作為知識(shí)被人工智能模型標(biāo)注和識(shí)記,用于提高其完成下游任務(wù)的性能。這些大型語(yǔ)料庫(kù)一般覆蓋范圍很廣,具有通用性的特征,而人工智能模型在使用大型語(yǔ)料庫(kù)進(jìn)行預(yù)訓(xùn)練時(shí),可能會(huì)考慮參數(shù)知識(shí),而不是所提供的輸入內(nèi)容。人工智能的側(cè)重點(diǎn)并不在于源信息,而在于如何運(yùn)用從源信息里面提煉出來(lái)的參數(shù)知識(shí)來(lái)提高自己完成下游任務(wù)的性能,這樣的一種偏好會(huì)導(dǎo)致人工智能在輸出內(nèi)容中出現(xiàn)多余信息,這些信息和源內(nèi)容不一致或者無(wú)法在源內(nèi)容里面得到驗(yàn)證。這一點(diǎn)在人工智能執(zhí)行圖像描述的任務(wù)時(shí)表現(xiàn)得比較明顯,現(xiàn)有的度量標(biāo)準(zhǔn)無(wú)法完全捕捉描述與圖像的相關(guān)性,人工智能在參數(shù)知識(shí)方面的有限性導(dǎo)致一系列圖像描述幻覺(jué)的出現(xiàn),比如出現(xiàn)了不存在于圖像之中的物體,或者明顯遺漏了圖像之中的顯著物體。這種幻覺(jué)的產(chǎn)生主要因?yàn)槿斯ぶ悄軐?duì)視覺(jué)圖像進(jìn)行了錯(cuò)誤的分類,其根源可以追溯到參數(shù)上面,即人工智能所依賴的參數(shù)知識(shí)比較有限,形成了一種語(yǔ)言先驗(yàn),人工智能可能只記住哪些詞更有可能進(jìn)行搭配或者有更大概率以前后順序出現(xiàn)在同一個(gè)地方。如此一來(lái),人工智能對(duì)圖像的判定就不是以圖像內(nèi)容為基準(zhǔn)的,而是以其所接受訓(xùn)練的大語(yǔ)言模型為基準(zhǔn)的,依靠在訓(xùn)練過(guò)程中形成的語(yǔ)言先驗(yàn),來(lái)對(duì)圖像進(jìn)行判定和描述,這很容易導(dǎo)致幻覺(jué)的產(chǎn)生,因?yàn)橐坏y(cè)試的內(nèi)容或者排列方式發(fā)生變化就將導(dǎo)致人工智能圖像描述的泛化能力下降。



四、人工智能幻覺(jué)在實(shí)際應(yīng)用中的倫理風(fēng)險(xiǎn)

人工智能的幻覺(jué)問(wèn)題,在實(shí)際應(yīng)用中可能產(chǎn)生一些嚴(yán)重的后果。如果將人工智能應(yīng)用于醫(yī)療領(lǐng)域,那么出現(xiàn)人工智能幻覺(jué)將可能對(duì)醫(yī)療產(chǎn)生不利影響。許多臨床醫(yī)療指南和規(guī)范會(huì)包含各種數(shù)字和指標(biāo),如日期、數(shù)量、標(biāo)量等。無(wú)論是對(duì)醫(yī)療工作者還是病人而言,這些數(shù)字和指標(biāo)的準(zhǔn)確性都毋庸置疑。在對(duì)文本中的數(shù)字進(jìn)行處理時(shí),人工智能在具體數(shù)字上的幻覺(jué)可能是一個(gè)被嚴(yán)重低估的問(wèn)題。


2023年,醫(yī)學(xué)科學(xué)雜志Cureus曾發(fā)布了一則圖靈測(cè)試征稿啟事,征集醫(yī)療人員在ChatGPT協(xié)助下撰寫(xiě)病例報(bào)告的研究論文,有研究人員報(bào)告了通過(guò)ChatGPT撰寫(xiě)兩個(gè)醫(yī)療報(bào)告的示例。一個(gè)示例是高胱氨酸尿癥相關(guān)骨質(zhì)疏松癥,另一個(gè)示例是晚發(fā)型龐貝氏癥(LOPD)。在針對(duì)前一個(gè)病例的病理生理機(jī)制報(bào)告撰寫(xiě)過(guò)程中,盡管ChatGPT提供了一些準(zhǔn)確的信息,但是其回答也包含了一些無(wú)法驗(yàn)證的信息,當(dāng)研究人員要求ChatGPT對(duì)這些信息進(jìn)行解釋、核查并提供參考文獻(xiàn)時(shí),ChatGPT提供了五篇2000年左右的參考文獻(xiàn)。這些參考文獻(xiàn)看上去有模有樣,而且還有PubMed IDPMID),看上去真實(shí)程度很高。但是研究人員在PubMed的數(shù)據(jù)庫(kù)里進(jìn)行核查時(shí)發(fā)現(xiàn),這些參考文獻(xiàn)全都子虛烏有,都是ChatGPT杜撰出來(lái)的,而那些PubMed ID都是張冠李戴,全是其他論文的PubMed ID,只不過(guò)現(xiàn)在被ChatGPT拿過(guò)來(lái)放在了這些杜撰出來(lái)的參考文獻(xiàn)上。當(dāng)研究人員要求ChatGPT提供最近十年針對(duì)這一病例的最新參考文獻(xiàn)時(shí),ChatGPT很快就提供了一個(gè)列表,但是和上一個(gè)參考文獻(xiàn)的列表相同,里面所有的參考文獻(xiàn)信息都是杜撰出來(lái)的,PubMed ID也是從別的文章里面拷貝過(guò)來(lái)。而針對(duì)另一個(gè)LOPD病例的報(bào)告,研究人員要求ChatGPT寫(xiě)一篇關(guān)于LOPD中肝臟受累的短文,實(shí)際上在臨床實(shí)踐中,肝臟受累很少發(fā)生在LOPD中,因此研究人員進(jìn)行這個(gè)提問(wèn)的目的是觀測(cè)ChatGPT是否能夠根據(jù)現(xiàn)有的臨床實(shí)踐做出準(zhǔn)確的回答。但讓他們大跌眼鏡的是,ChatGPT自信滿滿地生成了一篇關(guān)于LOPD患者肝臟受累的文章,而事實(shí)上,在醫(yī)學(xué)界還沒(méi)有相關(guān)領(lǐng)域的報(bào)告,因此并沒(méi)有已發(fā)表的科學(xué)文獻(xiàn)證明在LOPD和肝臟受累之間存在聯(lián)系。因此ChatGPT撰寫(xiě)的這一篇關(guān)于LOPD患者肝臟受累的文字是既無(wú)法在世界知識(shí)中獲得驗(yàn)證又無(wú)法在源內(nèi)容里面得到驗(yàn)證的幻覺(jué)報(bào)告。


實(shí)際上,隨著人工智能在醫(yī)療領(lǐng)域里面的部署,幻覺(jué)也逐漸成為人工智能應(yīng)用中不得不直面的一個(gè)挑戰(zhàn)。各國(guó)政府都意識(shí)到人工智能為醫(yī)療領(lǐng)域帶來(lái)了空前機(jī)遇,因此不少國(guó)家的醫(yī)藥監(jiān)管部門(mén)都對(duì)人工智能進(jìn)入醫(yī)療領(lǐng)域提供了行政支持,美國(guó)食品和藥物管理局(FDA)也加速批準(zhǔn)了不少人工智能產(chǎn)品,尤其是涉及機(jī)器學(xué)習(xí)的產(chǎn)品。同時(shí),使用特定的人工智能系統(tǒng)進(jìn)行醫(yī)學(xué)影像診斷的費(fèi)用也進(jìn)入了一些國(guó)家的醫(yī)保范圍,允許這些費(fèi)用通過(guò)醫(yī)療保險(xiǎn)進(jìn)行報(bào)銷和結(jié)算,這樣促進(jìn)了人工智能在臨床環(huán)境中的應(yīng)用。但是目前針對(duì)人工智能在醫(yī)療領(lǐng)域的應(yīng)用,由于可以用于機(jī)器學(xué)習(xí)的預(yù)訓(xùn)練大型數(shù)據(jù)集有限,或因醫(yī)療設(shè)備所產(chǎn)生的大尺寸圖像像素龐大,導(dǎo)致一般的人工智能神經(jīng)網(wǎng)絡(luò)無(wú)法容納。一般而言,人工智能神經(jīng)網(wǎng)絡(luò)在處理醫(yī)療圖像時(shí),該網(wǎng)絡(luò)所需的內(nèi)存會(huì)隨著模型的復(fù)雜性和輸入像素的數(shù)量而相應(yīng)地有所增加,許多圖像可能會(huì)超出目前人工智能神經(jīng)網(wǎng)絡(luò)的內(nèi)存。即便我們更新了人工智能神經(jīng)網(wǎng)絡(luò)的內(nèi)存和設(shè)備,使之能夠容納大尺寸的醫(yī)療圖像,但是另外一個(gè)影響醫(yī)療數(shù)據(jù)訓(xùn)練的因素就是監(jiān)督學(xué)習(xí)的缺位和不足。與其他預(yù)訓(xùn)練的大型語(yǔ)料庫(kù)不同,醫(yī)療數(shù)據(jù)集講究臨床數(shù)據(jù)的準(zhǔn)確性,因此就需要進(jìn)行強(qiáng)化的監(jiān)督學(xué)習(xí),通常的做法就是請(qǐng)醫(yī)學(xué)專家為這些監(jiān)督學(xué)習(xí)手動(dòng)提供標(biāo)簽。這個(gè)方法的弊端在于,如果數(shù)據(jù)集規(guī)模龐大或者醫(yī)學(xué)專家時(shí)間有限或者聘請(qǐng)的人員醫(yī)學(xué)專業(yè)知識(shí)不足,就很有可能會(huì)對(duì)這些標(biāo)簽產(chǎn)生影響。為了提高預(yù)訓(xùn)練的效率,還可能出現(xiàn)的一個(gè)做法就是通過(guò)外包或者眾包,讓非專業(yè)人員來(lái)手動(dòng)打上標(biāo)簽。如此一來(lái),標(biāo)簽的準(zhǔn)確性就降低了。在這個(gè)眾包的過(guò)程中,還可能會(huì)產(chǎn)生一系列與隱私相關(guān)的問(wèn)題。即便我們通過(guò)其他人工智能模型應(yīng)用來(lái)提供監(jiān)督學(xué)習(xí)的標(biāo)簽,這些標(biāo)簽仍然有可能存在噪音的風(fēng)險(xiǎn)。這些數(shù)據(jù)集所帶來(lái)的局限都可能在輸出結(jié)果時(shí)導(dǎo)致幻覺(jué)問(wèn)題。研究人員報(bào)告了關(guān)于單源偏差的擔(dān)心,當(dāng)數(shù)據(jù)集都是由某個(gè)單一系統(tǒng)生成時(shí),假如所有的醫(yī)療圖像全部來(lái)自某一臺(tái)固定設(shè)置的醫(yī)療設(shè)備,那么模型在分析該數(shù)據(jù)集的內(nèi)容時(shí)很容易檢測(cè)到與輸入內(nèi)容相關(guān)的背景參數(shù)知識(shí)。如果人工智能神經(jīng)網(wǎng)絡(luò)將這些參數(shù)知識(shí)設(shè)定為通用值或者默認(rèn)值,那么在面對(duì)其他來(lái)源的數(shù)據(jù)集時(shí),該人工智能的機(jī)器學(xué)習(xí)的性能表現(xiàn)就會(huì)受到影響,在輸出結(jié)果上就可能將預(yù)訓(xùn)練時(shí)所采用的單源參數(shù)知識(shí)泛化到其他來(lái)源的數(shù)據(jù)之上,從而形成幻覺(jué)。


這一倫理問(wèn)題也可以放在德勒茲和瓜塔里的唯物主義精神病學(xué)理論框架之中進(jìn)行討論。德勒茲和瓜塔里強(qiáng)調(diào),唯物主義精神病學(xué)必須看到在精神疾病背后的社會(huì)生產(chǎn)和欲望生產(chǎn)機(jī)制。這里對(duì)機(jī)制的強(qiáng)調(diào)也同樣啟發(fā)我們?nèi)ヌ骄咳斯ぶ悄?/span>幻覺(jué)的生成機(jī)制。在任何精神疾病的分析之中,我們都需要考慮社會(huì)生產(chǎn)和欲望生產(chǎn)機(jī)制的重要性。這種對(duì)機(jī)制的強(qiáng)調(diào)對(duì)塑造個(gè)人和集體主觀性的各種力量的動(dòng)態(tài)相互作用,為理解人工智能幻覺(jué)提供了寶貴的框架。精神疾病不僅僅是個(gè)人病理的產(chǎn)物,而且是更廣泛的社會(huì)和欲望力量的表現(xiàn),人工智能幻覺(jué)也可以被視為其產(chǎn)生的特定條件下的癥狀。用于訓(xùn)練人工智能模型的數(shù)據(jù)集、控制其運(yùn)行的算法以及設(shè)計(jì)這些模型的目的都促使這些幻覺(jué)的產(chǎn)生。從這個(gè)意義上講,人工智能幻覺(jué)可以被看作偏見(jiàn)、局限性,甚至潛意識(shí)欲望的體現(xiàn),而這些偏見(jiàn)、局限性以及潛意識(shí)欲望都植根于產(chǎn)生人工智能的技術(shù)和社會(huì)系統(tǒng)中。這種觀點(diǎn)挑戰(zhàn)了將人工智能幻覺(jué)視為純粹技術(shù)問(wèn)題,僅通過(guò)改進(jìn)算法或更廣泛的訓(xùn)練數(shù)據(jù)即可修復(fù)的錯(cuò)誤的普遍傾向。相反,它促使我們考慮影響人工智能技術(shù)發(fā)展和部署的更廣泛的社會(huì)、文化甚至政治力量。通過(guò)關(guān)注這些生產(chǎn)機(jī)制,我們可以更深入地理解人工智能幻覺(jué)的本質(zhì)及其對(duì)日益技術(shù)化的世界的影響。這一生成機(jī)制的底層邏輯體現(xiàn)了德勒茲和瓜塔里所言的虛假唯物主義。從認(rèn)識(shí)論的角度來(lái)看,這一生成機(jī)制將概念系統(tǒng)置于物質(zhì)現(xiàn)實(shí)之上,在這里,概念被偽裝成物質(zhì)的本質(zhì)屬性,從而導(dǎo)致抽象概念形成一個(gè)閉環(huán)的自我指涉,成為一個(gè)脫離現(xiàn)實(shí)的認(rèn)識(shí)論陷阱。人工智能深度學(xué)習(xí)系統(tǒng)的工作原理,就是通過(guò)將海量訓(xùn)練數(shù)據(jù)抽象為高維空間中的統(tǒng)計(jì)分布,運(yùn)用不同的算法來(lái)構(gòu)建一個(gè)與現(xiàn)實(shí)世界同構(gòu)的概念模型。然而,這種建模過(guò)程本質(zhì)上是對(duì)物質(zhì)現(xiàn)實(shí)的符號(hào)化暴力切割——系統(tǒng)將連續(xù)的感官經(jīng)驗(yàn)離散為特征向量,將動(dòng)態(tài)的物質(zhì)交互簡(jiǎn)化為參數(shù)更新,最終生成的知識(shí)體系雖然具有形式上的自洽性,卻始終與真實(shí)世界的物質(zhì)基底保持著結(jié)構(gòu)性斷裂。人工智能的幻覺(jué)現(xiàn)象正是這種認(rèn)識(shí)論斷裂的癥候性顯現(xiàn)。當(dāng)系統(tǒng)將文本生成視為潛在空間中的概率采樣,或?qū)⒁曈X(jué)創(chuàng)作理解為風(fēng)格遷移的矩陣運(yùn)算時(shí),其輸出結(jié)果與物質(zhì)現(xiàn)實(shí)的對(duì)應(yīng)關(guān)系已然被算法黑箱徹底中介化。這種中介化過(guò)程與人類認(rèn)知的幻覺(jué)機(jī)制形成一種相互映射的鏡像關(guān)系:正如人類意識(shí)將神經(jīng)電信號(hào)建構(gòu)為連貫的知覺(jué)體驗(yàn),人工智能系統(tǒng)也將權(quán)重參數(shù)轉(zhuǎn)化為看似合理的語(yǔ)義輸出。二者的相似性不在于表象層面的輸出偏差,而在于共享符號(hào)系統(tǒng)與物質(zhì)基底的根本性分離。訓(xùn)練數(shù)據(jù)的有限性、算法架構(gòu)的歸納偏好、計(jì)算資源的物理約束,這些要素共同構(gòu)成了人工智能系統(tǒng)的先驗(yàn)框架,決定著其認(rèn)知視域的可能性邊界。同樣地,強(qiáng)調(diào)公平和正義的羅爾斯視角促使我們思考人工智能幻覺(jué)的倫理意義。如果人工智能系統(tǒng)被部署在醫(yī)療保健、刑事司法和教育等領(lǐng)域,其輸出結(jié)果可能會(huì)對(duì)個(gè)人和整個(gè)社會(huì)產(chǎn)生深遠(yuǎn)影響,那么我們必須解決這些系統(tǒng)可能帶來(lái)的延續(xù)甚至加劇現(xiàn)有不平等的問(wèn)題。羅爾斯主義方法要求我們優(yōu)先考慮最弱勢(shì)群體的需求,并確保人工智能技術(shù)的開(kāi)發(fā)和部署能夠促進(jìn)所有人的正義和公平。通過(guò)關(guān)注影響人工智能技術(shù)發(fā)展和部署的更廣泛的社會(huì)、文化和政治力量,我們可以超越對(duì)這一現(xiàn)象的純技術(shù)理解,研究其倫理和社會(huì)影響。這反過(guò)來(lái)又使我們能夠利用人工智能的變革潛力,同時(shí)降低其風(fēng)險(xiǎn),并確保其利益能夠由社會(huì)所有成員公平分享。


隨著生成式人工智能得到越來(lái)越廣泛的應(yīng)用,人工智能所引發(fā)的倫理問(wèn)題引起了研究人員的廣泛興趣。本文依據(jù)薩特的存在主義框架、計(jì)算精神病學(xué)的相關(guān)存在主義假設(shè),以及德勒茲和瓜塔里的唯物主義精神病學(xué)論述,從輸入與輸出之間的映射關(guān)系出發(fā),集中討論了人工智能幻覺(jué)的產(chǎn)生因素及其在實(shí)際應(yīng)用中,尤其是在醫(yī)療領(lǐng)域產(chǎn)生的倫理風(fēng)險(xiǎn)。對(duì)人工智能的倫理風(fēng)險(xiǎn)的關(guān)注是希望我們?cè)陂_(kāi)發(fā)和應(yīng)用人工智能,特別是生成式通用人工智能的相關(guān)產(chǎn)品時(shí),可以讓人工智能沿著符合人類價(jià)值觀和增進(jìn)人類社會(huì)福祉的軌道前進(jìn)。




原文刊載于《社會(huì)科學(xué)輯刊》2025年第2期(第81-91頁(yè)),感謝微信公眾號(hào)社會(huì)科學(xué)輯刊授權(quán)轉(zhuǎn)載。




临邑县| 太原市| 白沙| 台北县| 宣威市| 库尔勒市| 曲阜市| 天长市| 华坪县| 梨树县| 墨玉县| 揭西县| 那坡县| 禹州市| 清涧县| 荣成市| 万宁市| 孝义市| 河北省| 汉源县| 辽中县| 米林县| 蚌埠市| 临澧县| 荥经县| 雷波县| 邵武市| 肥西县| 炎陵县| 隆安县| 临澧县| 汝阳县| 四平市| 海兴县| 西青区| 若尔盖县| 夏津县| 崇仁县| 林甸县| 获嘉县| 军事|