從感知到認(rèn)知，“知識(shí)方程”能否通向強(qiáng)人工智能

2023-08-30 09:22:43 來源：文匯報(bào)

評(píng)論

人工智能（AI）大模型的誕生，讓2023年成為人類歷史上一個(gè)重要年份——通用人工智能元年。這意味著以智能革命為代表的第四次工業(yè)革命已然到來，人類站到了智能時(shí)代的門檻上。

【資料圖】

人類所經(jīng)歷的前三次工業(yè)革命，都令人類文明實(shí)現(xiàn)了新的飛躍，也對(duì)世界格局產(chǎn)生了深遠(yuǎn)影響。長(zhǎng)遠(yuǎn)來看，人工智能在很多方面的智慧能力將可能超過人類，但目前通用人工智能還需邁過多道門檻，才能真正實(shí)現(xiàn)強(qiáng)人工智能。

日前，中國科學(xué)技術(shù)大學(xué)知識(shí)計(jì)算實(shí)驗(yàn)室提出了新的知識(shí)模型“知識(shí)方程”，并以此為基礎(chǔ)建立新型專家系統(tǒng)，通過與深度學(xué)習(xí)的結(jié)合，嘗試突破現(xiàn)有通用人工智能的技術(shù)瓶頸。

人工智能（AI）誕生至今只有短短60多年，但其發(fā)展經(jīng)歷了幾度跌宕起伏。近年來，深度學(xué)習(xí)技術(shù)為AI帶來了新的革命，其中包括我們熟悉的AlphaGo、ChatGPT等。

當(dāng)前AI技術(shù)在很多任務(wù)上取得了超越人類的成效，包括人臉識(shí)別、語音識(shí)別、字符識(shí)別等，在機(jī)器翻譯、問答和醫(yī)療診斷等領(lǐng)域也交出了令人相對(duì)滿意的答卷。可以說，AI已經(jīng)邁入能夠大規(guī)模落地應(yīng)用的階段。

不過，當(dāng)我們?cè)噲D將人工智能再向前推進(jìn)，就會(huì)發(fā)現(xiàn)要克服其現(xiàn)有缺陷，還有待技術(shù)模式的創(chuàng)新與突破。

當(dāng)下大模型面臨4個(gè)關(guān)鍵缺陷

OpenAI公司推出的ChatGPT是一個(gè)AI聊天機(jī)器人程序，更是一個(gè)人工智能自動(dòng)生成內(nèi)容（AIGC）的工具。作為一個(gè)對(duì)話系統(tǒng)，ChatGPT具備出色的多功能性，無論是暢聊多種話題、解答數(shù)學(xué)題，還是提供禮品選擇建議、制定行程規(guī)劃，都可從容應(yīng)對(duì)。因此，從某種意義上來說，ChatGPT具備了廣泛的應(yīng)用潛力和靈活性，可以說是一個(gè)通用人工智能（AGI）程序。

盡管在某些方面（例如邏輯和語義理解等）的評(píng)測(cè)表明，ChatGPT并非在所有領(lǐng)域都比現(xiàn)有的最佳模型更強(qiáng)大，但現(xiàn)有的最佳模型可能只是針對(duì)特定任務(wù)而設(shè)計(jì)，而ChatGPT則是一個(gè)通用模型。

其實(shí)，多年前人們就認(rèn)識(shí)到大模型的巨大潛力，但其實(shí)際發(fā)展速度仍比預(yù)想中快了許多。ChatGPT大模型甫一問世，很快就在應(yīng)用層面受到極大關(guān)注。半年后，中國就涌現(xiàn)出了百余個(gè)大模型。

目前，大模型的應(yīng)用主要分為生成式人工智能（AIGC）、大模型輔助工具、個(gè)人智能交互3類。其中，個(gè)人智能交互尤其值得關(guān)注。任何真正能促進(jìn)交互的技術(shù)和產(chǎn)品都能產(chǎn)生巨大價(jià)值。這種交互不僅包括“人—人”（通過機(jī)器），也包括“人—機(jī)”，甚至包括“機(jī)—機(jī)”。而人工智能，包括大模型，有望在這方面取得顛覆性突破。

然而，目前大模型的應(yīng)用之路并不如想象的那么順利。根本原因在于，雖然大模型很強(qiáng)大，但仍然在技術(shù)上存在一些關(guān)鍵缺陷。

首先，大模型有時(shí)會(huì)犯事實(shí)性錯(cuò)誤，也就是可靠性問題（俗稱“幻覺”）。例如，它會(huì)弄錯(cuò)詩詞作者。從原理看，大模型的答案選擇基于概率，所以很難保證百分百正確。這一問題在目前許多領(lǐng)域的大模型中都存在，也是大模型面臨的最重要的挑戰(zhàn)之一。

第二，大模型的數(shù)學(xué)和邏輯推理能力仍然需要加強(qiáng)。雖然GPT-4在某些考試中表現(xiàn)優(yōu)異，但在面對(duì)一些精心設(shè)計(jì)的邏輯推理問題時(shí)，大模型的回答與隨機(jī)答案相差無幾。因?yàn)樵谶M(jìn)行深度推理時(shí)，即便大模型每一步的預(yù)測(cè)準(zhǔn)確率都高達(dá)95%，但是當(dāng)推理到20步時(shí)，最終的準(zhǔn)確率將會(huì)是0.95的20次方，即不到36%，這是一個(gè)無法令人滿意的結(jié)果。

第三，大模型的形式語義理解能力有待提升。雖然大模型在一定程度上能夠?qū)崿F(xiàn)語義理解，但要想真正從意義和形式上完全理解語言背后的意義，還有很大的改進(jìn)空間。

最后，大模型作為一個(gè)黑盒模型，存在一些通用弱點(diǎn)。比如，其可解釋性、可調(diào)試的能力較弱等。

通向強(qiáng)人工智能或需另辟蹊徑

大模型開啟了通用人工智能落地應(yīng)用的窗口。但正如前文所說，技術(shù)上的一些關(guān)鍵缺陷意味著它與通用強(qiáng)人工智能之間尚有很大距離。要縮短這個(gè)距離，至少有兩條不同路徑值得探索。

第一條路徑就是繼續(xù)沿著大模型現(xiàn)有的發(fā)展路線向前走。AI誕生不過60多年，GPT真正開始訓(xùn)練至今也只有5年。如果讓大模型再發(fā)展5年、50年、500年，它會(huì)取得怎樣的進(jìn)步？這是一個(gè)值得思考的問題。

沿著現(xiàn)有技術(shù)路線，大模型的發(fā)展在兩個(gè)關(guān)鍵點(diǎn)上會(huì)遇到一定的挑戰(zhàn)。

其一，更多的參數(shù)。參數(shù)量的增加，會(huì)讓大模型的能力提升。摩爾定律表明，計(jì)算能力每18個(gè)月到24個(gè)月翻一番，而目前大模型的參數(shù)量正以三四個(gè)月翻番的速度增長(zhǎng)。因此，計(jì)算能力很快會(huì)跟不上模型的發(fā)展需求。而且，盡管參數(shù)量呈指數(shù)級(jí)增長(zhǎng)，但其效果只呈線性增長(zhǎng)。

其二，更多的數(shù)據(jù)。優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)的增加，也會(huì)讓大模型的能力提升。然而，GPT-4已經(jīng)利用了大部分目前我們能夠獲取到的高質(zhì)量文本數(shù)據(jù)。因此，可供大模型訓(xùn)練的數(shù)據(jù)即將達(dá)到瓶頸。

所以，要在大模型體系內(nèi)解決這些問題，就需要發(fā)展新的顛覆性技術(shù)，來突破結(jié)構(gòu)化信息、陳述性事實(shí)、長(zhǎng)鏈條推理、深度語義理解等方面遇到的瓶頸。

另一條通往通用強(qiáng)人工智能的路徑則有很大不同。

當(dāng)前AI正在經(jīng)歷從感知智能向認(rèn)知智能的范式轉(zhuǎn)變。眾所周知，人類擁有兩套推理系統(tǒng)，即直覺思考的快系統(tǒng)和理性思考的慢系統(tǒng)?？煜到y(tǒng)是一種底層、快速、下意識(shí)、不加思索便可即刻得到結(jié)論的推理方式，就像人們?cè)诩依镩]著眼睛也能找到洗手間的位置；而當(dāng)我們面對(duì)陌生環(huán)境，想要找洗手間時(shí)，則需要依賴慢系統(tǒng)進(jìn)行慎思，這種推理相對(duì)較慢、能耗較高，但更精確。

目前的大模型更多涉及到的是快系統(tǒng)層面的推理，慢系統(tǒng)推理能力表現(xiàn)還不佳。所以，人們自然而然就會(huì)想到，能否將這兩個(gè)系統(tǒng)結(jié)合起來。

事實(shí)上，上一波AI浪潮就是由專家系統(tǒng)驅(qū)動(dòng)的。專家系統(tǒng)是一種類似于人類慢系統(tǒng)的推理方式，它以符號(hào)的方式把專家的知識(shí)輸入機(jī)器，再通過自動(dòng)推理，使得機(jī)器能夠像專家一樣自動(dòng)回答問題。

專家系統(tǒng)與大模型各有所長(zhǎng)。前者在精確度、可解釋性、邏輯推理能力、語義理解能力等方面表現(xiàn)更佳，而后者在通用性、泛化性、不確定性知識(shí)、學(xué)習(xí)能力等方面更具優(yōu)勢(shì)。因此，專家系統(tǒng)與大模型有機(jī)結(jié)合，正好可以取長(zhǎng)補(bǔ)短，這或是通往通用強(qiáng)人工智能的一條更好路徑。

融合兩大推理系統(tǒng)探索未來智能

中國科學(xué)家在專家系統(tǒng)與大模型結(jié)合的道路上，已經(jīng)開始了探索。中國科學(xué)技術(shù)大學(xué)知識(shí)計(jì)算實(shí)驗(yàn)室提出了新的知識(shí)模型“知識(shí)方程”，在此基礎(chǔ)上建立起新型專家系統(tǒng)，并將其與深度學(xué)習(xí)相融合。

簡(jiǎn)言之，知識(shí)方程分為建模和知識(shí)2個(gè)層面。在建模層面，知識(shí)方程將領(lǐng)域?qū)ο蠼y(tǒng)一抽象成為個(gè)體、概念、算子3類語法元素，它們之間可以相互轉(zhuǎn)換、相互融合。在知識(shí)層面，知識(shí)方程將所有知識(shí)統(tǒng)一表示成為形如“a=b”的知識(shí)等式。基于知識(shí)方程，我們提出了基于新的數(shù)據(jù)與知識(shí)雙輪驅(qū)動(dòng)的、結(jié)合大模型與推理引擎的智能信息系統(tǒng)范式。

隨著ChatGPT等大語言模型的興起，在原有以數(shù)據(jù)庫為核心的信息系統(tǒng)之上，大模型可從暗數(shù)據(jù)庫（文本、圖像、視頻等）中挖掘有效信息，并在一定程度上進(jìn)行推理與（輔助）決策。

事實(shí)上，這是信息系統(tǒng)的一次范式革命。在所有數(shù)據(jù)中，暗數(shù)據(jù)占到絕大部分。傳統(tǒng)的信息系統(tǒng)必須通過一些手段（包括人工、自然語言處理、計(jì)算機(jī)視覺技術(shù)等），將“暗”數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)庫中的“明”數(shù)據(jù)才能使用。這種轉(zhuǎn)換往往由于工程和成本等問題，只能處理暗數(shù)據(jù)中的極小部分。而大模型可以直接基于暗數(shù)據(jù)得以輸出，具有很強(qiáng)的暗數(shù)據(jù)處理能力。

基于大模型的信息系統(tǒng)類似于人類用于直覺思考的快系統(tǒng)，能在一定程度上直接基于大數(shù)據(jù)進(jìn)行推理與決策。但由于大模型目前存在的技術(shù)缺陷，在很多應(yīng)用場(chǎng)景并不能直接滿足應(yīng)用要求。中科大知識(shí)計(jì)算實(shí)驗(yàn)室所提出的大模型增強(qiáng)技術(shù)，可構(gòu)建領(lǐng)域本體與知識(shí)庫，在此基礎(chǔ)上融合大模型與知識(shí)推理引擎，研發(fā)知識(shí)數(shù)據(jù)雙驅(qū)動(dòng)的智能信息系統(tǒng)框架，將思考的快系統(tǒng)與慢系統(tǒng)結(jié)合起來。與單純的大模型相比，該框架具有正確性、可靠性、可解釋性、可調(diào)試性等優(yōu)點(diǎn)，能夠顯著提高大模型在各行各業(yè)的應(yīng)用價(jià)值。

除了數(shù)據(jù)庫和暗數(shù)據(jù)庫，該系統(tǒng)還可有效利用知識(shí)庫的信息。因此，該框架有望引領(lǐng)大模型之后的又一次信息系統(tǒng)范式革命，也將成為智能信息系統(tǒng)的新形態(tài)。

從應(yīng)用角度看，通用強(qiáng)人工智能無論在廣度，還是在深度方面，都是現(xiàn)有的大模型技術(shù)無法比擬的。從長(zhǎng)遠(yuǎn)來看，人工智能在很多方面的智慧能力可能會(huì)超過人類，不僅是計(jì)算、記憶和存儲(chǔ)等基礎(chǔ)智能，還可能包括決策、預(yù)測(cè)、創(chuàng)新等高階智能。隨著基于計(jì)算的大模型和知識(shí)推理引擎的不斷發(fā)展，AI也將越來越接近甚至超越人類，這將在極大程度上推動(dòng)生產(chǎn)力。

（作者為中國科學(xué)技術(shù)大學(xué)教授、知識(shí)計(jì)算實(shí)驗(yàn)室主任）