從感知到認(rèn)知,“知識(shí)方程”能否通向強(qiáng)人工智能
2023-08-30 09:22:43 來源:文匯報(bào)
人工智能(AI)大模型的誕生,讓2023年成為人類歷史上一個(gè)重要年份——通用人工智能元年。這意味著以智能革命為代表的第四次工業(yè)革命已然到來,人類站到了智能時(shí)代的門檻上。
【資料圖】
人類所經(jīng)歷的前三次工業(yè)革命,都令人類文明實(shí)現(xiàn)了新的飛躍,也對(duì)世界格局產(chǎn)生了深遠(yuǎn)影響。長(zhǎng)遠(yuǎn)來看,人工智能在很多方面的智慧能力將可能超過人類,但目前通用人工智能還需邁過多道門檻,才能真正實(shí)現(xiàn)強(qiáng)人工智能。
日前,中國科學(xué)技術(shù)大學(xué)知識(shí)計(jì)算實(shí)驗(yàn)室提出了新的知識(shí)模型“知識(shí)方程”,并以此為基礎(chǔ)建立新型專家系統(tǒng),通過與深度學(xué)習(xí)的結(jié)合,嘗試突破現(xiàn)有通用人工智能的技術(shù)瓶頸。
人工智能(AI)誕生至今只有短短60多年,但其發(fā)展經(jīng)歷了幾度跌宕起伏。近年來,深度學(xué)習(xí)技術(shù)為AI帶來了新的革命,其中包括我們熟悉的AlphaGo、ChatGPT等。
當(dāng)前AI技術(shù)在很多任務(wù)上取得了超越人類的成效,包括人臉識(shí)別、語音識(shí)別、字符識(shí)別等,在機(jī)器翻譯、問答和醫(yī)療診斷等領(lǐng)域也交出了令人相對(duì)滿意的答卷。可以說,AI已經(jīng)邁入能夠大規(guī)模落地應(yīng)用的階段。
不過,當(dāng)我們?cè)噲D將人工智能再向前推進(jìn),就會(huì)發(fā)現(xiàn)要克服其現(xiàn)有缺陷,還有待技術(shù)模式的創(chuàng)新與突破。
當(dāng)下大模型面臨4個(gè)關(guān)鍵缺陷
OpenAI公司推出的ChatGPT是一個(gè)AI聊天機(jī)器人程序,更是一個(gè)人工智能自動(dòng)生成內(nèi)容(AIGC)的工具。作為一個(gè)對(duì)話系統(tǒng),ChatGPT具備出色的多功能性,無論是暢聊多種話題、解答數(shù)學(xué)題,還是提供禮品選擇建議、制定行程規(guī)劃,都可從容應(yīng)對(duì)。因此,從某種意義上來說,ChatGPT具備了廣泛的應(yīng)用潛力和靈活性,可以說是一個(gè)通用人工智能(AGI)程序。
盡管在某些方面(例如邏輯和語義理解等)的評(píng)測(cè)表明,ChatGPT并非在所有領(lǐng)域都比現(xiàn)有的最佳模型更強(qiáng)大,但現(xiàn)有的最佳模型可能只是針對(duì)特定任務(wù)而設(shè)計(jì),而ChatGPT則是一個(gè)通用模型。
其實(shí),多年前人們就認(rèn)識(shí)到大模型的巨大潛力,但其實(shí)際發(fā)展速度仍比預(yù)想中快了許多。ChatGPT大模型甫一問世,很快就在應(yīng)用層面受到極大關(guān)注。半年后,中國就涌現(xiàn)出了百余個(gè)大模型。
目前,大模型的應(yīng)用主要分為生成式人工智能(AIGC)、大模型輔助工具、個(gè)人智能交互3類。其中,個(gè)人智能交互尤其值得關(guān)注。任何真正能促進(jìn)交互的技術(shù)和產(chǎn)品都能產(chǎn)生巨大價(jià)值。這種交互不僅包括“人—人”(通過機(jī)器),也包括“人—機(jī)”,甚至包括“機(jī)—機(jī)”。而人工智能,包括大模型,有望在這方面取得顛覆性突破。
然而,目前大模型的應(yīng)用之路并不如想象的那么順利。根本原因在于,雖然大模型很強(qiáng)大,但仍然在技術(shù)上存在一些關(guān)鍵缺陷。
首先,大模型有時(shí)會(huì)犯事實(shí)性錯(cuò)誤,也就是可靠性問題(俗稱“幻覺”)。例如,它會(huì)弄錯(cuò)詩詞作者。從原理看,大模型的答案選擇基于概率,所以很難保證百分百正確。這一問題在目前許多領(lǐng)域的大模型中都存在,也是大模型面臨的最重要的挑戰(zhàn)之一。
第二,大模型的數(shù)學(xué)和邏輯推理能力仍然需要加強(qiáng)。雖然GPT-4在某些考試中表現(xiàn)優(yōu)異,但在面對(duì)一些精心設(shè)計(jì)的邏輯推理問題時(shí),大模型的回答與隨機(jī)答案相差無幾。因?yàn)樵谶M(jìn)行深度推理時(shí),即便大模型每一步的預(yù)測(cè)準(zhǔn)確率都高達(dá)95%,但是當(dāng)推理到20步時(shí),最終的準(zhǔn)確率將會(huì)是0.95的20次方,即不到36%,這是一個(gè)無法令人滿意的結(jié)果。
第三,大模型的形式語義理解能力有待提升。雖然大模型在一定程度上能夠?qū)崿F(xiàn)語義理解,但要想真正從意義和形式上完全理解語言背后的意義,還有很大的改進(jìn)空間。
最后,大模型作為一個(gè)黑盒模型,存在一些通用弱點(diǎn)。比如,其可解釋性、可調(diào)試的能力較弱等。
通向強(qiáng)人工智能或需另辟蹊徑
大模型開啟了通用人工智能落地應(yīng)用的窗口。但正如前文所說,技術(shù)上的一些關(guān)鍵缺陷意味著它與通用強(qiáng)人工智能之間尚有很大距離。要縮短這個(gè)距離,至少有兩條不同路徑值得探索。
第一條路徑就是繼續(xù)沿著大模型現(xiàn)有的發(fā)展路線向前走。AI誕生不過60多年,GPT真正開始訓(xùn)練至今也只有5年。如果讓大模型再發(fā)展5年、50年、500年,它會(huì)取得怎樣的進(jìn)步?這是一個(gè)值得思考的問題。
沿著現(xiàn)有技術(shù)路線,大模型的發(fā)展在兩個(gè)關(guān)鍵點(diǎn)上會(huì)遇到一定的挑戰(zhàn)。
其一,更多的參數(shù)。參數(shù)量的增加,會(huì)讓大模型的能力提升。摩爾定律表明,計(jì)算能力每18個(gè)月到24個(gè)月翻一番,而目前大模型的參數(shù)量正以三四個(gè)月翻番的速度增長(zhǎng)。因此,計(jì)算能力很快會(huì)跟不上模型的發(fā)展需求。而且,盡管參數(shù)量呈指數(shù)級(jí)增長(zhǎng),但其效果只呈線性增長(zhǎng)。
其二,更多的數(shù)據(jù)。優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)的增加,也會(huì)讓大模型的能力提升。然而,GPT-4已經(jīng)利用了大部分目前我們能夠獲取到的高質(zhì)量文本數(shù)據(jù)。因此,可供大模型訓(xùn)練的數(shù)據(jù)即將達(dá)到瓶頸。
所以,要在大模型體系內(nèi)解決這些問題,就需要發(fā)展新的顛覆性技術(shù),來突破結(jié)構(gòu)化信息、陳述性事實(shí)、長(zhǎng)鏈條推理、深度語義理解等方面遇到的瓶頸。
另一條通往通用強(qiáng)人工智能的路徑則有很大不同。
當(dāng)前AI正在經(jīng)歷從感知智能向認(rèn)知智能的范式轉(zhuǎn)變。眾所周知,人類擁有兩套推理系統(tǒng),即直覺思考的快系統(tǒng)和理性思考的慢系統(tǒng)??煜到y(tǒng)是一種底層、快速、下意識(shí)、不加思索便可即刻得到結(jié)論的推理方式,就像人們?cè)诩依镩]著眼睛也能找到洗手間的位置;而當(dāng)我們面對(duì)陌生環(huán)境,想要找洗手間時(shí),則需要依賴慢系統(tǒng)進(jìn)行慎思,這種推理相對(duì)較慢、能耗較高,但更精確。
目前的大模型更多涉及到的是快系統(tǒng)層面的推理,慢系統(tǒng)推理能力表現(xiàn)還不佳。所以,人們自然而然就會(huì)想到,能否將這兩個(gè)系統(tǒng)結(jié)合起來。
事實(shí)上,上一波AI浪潮就是由專家系統(tǒng)驅(qū)動(dòng)的。專家系統(tǒng)是一種類似于人類慢系統(tǒng)的推理方式,它以符號(hào)的方式把專家的知識(shí)輸入機(jī)器,再通過自動(dòng)推理,使得機(jī)器能夠像專家一樣自動(dòng)回答問題。
專家系統(tǒng)與大模型各有所長(zhǎng)。前者在精確度、可解釋性、邏輯推理能力、語義理解能力等方面表現(xiàn)更佳,而后者在通用性、泛化性、不確定性知識(shí)、學(xué)習(xí)能力等方面更具優(yōu)勢(shì)。因此,專家系統(tǒng)與大模型有機(jī)結(jié)合,正好可以取長(zhǎng)補(bǔ)短,這或是通往通用強(qiáng)人工智能的一條更好路徑。
融合兩大推理系統(tǒng)探索未來智能
中國科學(xué)家在專家系統(tǒng)與大模型結(jié)合的道路上,已經(jīng)開始了探索。中國科學(xué)技術(shù)大學(xué)知識(shí)計(jì)算實(shí)驗(yàn)室提出了新的知識(shí)模型“知識(shí)方程”,在此基礎(chǔ)上建立起新型專家系統(tǒng),并將其與深度學(xué)習(xí)相融合。
簡(jiǎn)言之,知識(shí)方程分為建模和知識(shí)2個(gè)層面。在建模層面,知識(shí)方程將領(lǐng)域?qū)ο蠼y(tǒng)一抽象成為個(gè)體、概念、算子3類語法元素,它們之間可以相互轉(zhuǎn)換、相互融合。在知識(shí)層面,知識(shí)方程將所有知識(shí)統(tǒng)一表示成為形如“a=b”的知識(shí)等式。基于知識(shí)方程,我們提出了基于新的數(shù)據(jù)與知識(shí)雙輪驅(qū)動(dòng)的、結(jié)合大模型與推理引擎的智能信息系統(tǒng)范式。
隨著ChatGPT等大語言模型的興起,在原有以數(shù)據(jù)庫為核心的信息系統(tǒng)之上,大模型可從暗數(shù)據(jù)庫(文本、圖像、視頻等)中挖掘有效信息,并在一定程度上進(jìn)行推理與(輔助)決策。
事實(shí)上,這是信息系統(tǒng)的一次范式革命。在所有數(shù)據(jù)中,暗數(shù)據(jù)占到絕大部分。傳統(tǒng)的信息系統(tǒng)必須通過一些手段(包括人工、自然語言處理、計(jì)算機(jī)視覺技術(shù)等),將“暗”數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)庫中的“明”數(shù)據(jù)才能使用。這種轉(zhuǎn)換往往由于工程和成本等問題,只能處理暗數(shù)據(jù)中的極小部分。而大模型可以直接基于暗數(shù)據(jù)得以輸出,具有很強(qiáng)的暗數(shù)據(jù)處理能力。
基于大模型的信息系統(tǒng)類似于人類用于直覺思考的快系統(tǒng),能在一定程度上直接基于大數(shù)據(jù)進(jìn)行推理與決策。但由于大模型目前存在的技術(shù)缺陷,在很多應(yīng)用場(chǎng)景并不能直接滿足應(yīng)用要求。中科大知識(shí)計(jì)算實(shí)驗(yàn)室所提出的大模型增強(qiáng)技術(shù),可構(gòu)建領(lǐng)域本體與知識(shí)庫,在此基礎(chǔ)上融合大模型與知識(shí)推理引擎,研發(fā)知識(shí)數(shù)據(jù)雙驅(qū)動(dòng)的智能信息系統(tǒng)框架,將思考的快系統(tǒng)與慢系統(tǒng)結(jié)合起來。與單純的大模型相比,該框架具有正確性、可靠性、可解釋性、可調(diào)試性等優(yōu)點(diǎn),能夠顯著提高大模型在各行各業(yè)的應(yīng)用價(jià)值。
除了數(shù)據(jù)庫和暗數(shù)據(jù)庫,該系統(tǒng)還可有效利用知識(shí)庫的信息。因此,該框架有望引領(lǐng)大模型之后的又一次信息系統(tǒng)范式革命,也將成為智能信息系統(tǒng)的新形態(tài)。
從應(yīng)用角度看,通用強(qiáng)人工智能無論在廣度,還是在深度方面,都是現(xiàn)有的大模型技術(shù)無法比擬的。從長(zhǎng)遠(yuǎn)來看,人工智能在很多方面的智慧能力可能會(huì)超過人類,不僅是計(jì)算、記憶和存儲(chǔ)等基礎(chǔ)智能,還可能包括決策、預(yù)測(cè)、創(chuàng)新等高階智能。隨著基于計(jì)算的大模型和知識(shí)推理引擎的不斷發(fā)展,AI也將越來越接近甚至超越人類,這將在極大程度上推動(dòng)生產(chǎn)力。
(作者為中國科學(xué)技術(shù)大學(xué)教授、知識(shí)計(jì)算實(shí)驗(yàn)室主任)
關(guān)鍵詞:
相關(guān)閱讀
- (2023-08-30)從感知到認(rèn)知,“知識(shí)方程”能否通向強(qiáng)人工智能
- (2023-08-30)未來8天,四大生肖福氣享不盡,蓄勢(shì)待發(fā),事業(yè)終有所成
- (2023-08-30)靖哥哥別走!屈居亞軍后 Jingg在機(jī)場(chǎng)和PRX的隊(duì)友們以及教練告別
- (2023-08-30)核污染陰影籠罩下,我們?nèi)绾挝从昃I繆?
- (2023-08-30)“模擬駕駛飛機(jī)太好玩了”
- (2023-08-30)航發(fā)動(dòng)力股東戶數(shù)增加1390戶,戶均持股66.94萬元
- (2023-08-30)浙江杭州臨安區(qū)局(分公司)開展零售客戶幫扶志愿活動(dòng)
- (2023-08-30)武漢局集團(tuán)公司:加強(qiáng)值班值守迎戰(zhàn)出伏首輪強(qiáng)降雨
- (2023-08-30)海南表彰一批見義勇為英雄和先進(jìn)分子
- (2023-08-30)山東省梁山縣總工會(huì)聯(lián)合縣心理健康中心舉辦職工心理健康知識(shí)講座活動(dòng)
- (2023-08-30)今日173股公布2023年半年報(bào),93股凈利潤(rùn)同比增長(zhǎng)
- (2023-08-30)兩分鐘了解期權(quán)交易中的保證金管理應(yīng)該注意些什么?
- (2023-08-30)起亞EV5車型內(nèi)飾官圖發(fā)布:多處配實(shí)體按鍵,中控臺(tái)“棱角分明”
- (2023-08-30)湖北孝感:朱湖糯米這張名片越來越亮
- (2023-08-30)給力!旅客丟失物品 沙灣鐵警火速找回
- (2023-08-30)建業(yè)建榮(01556)發(fā)布中期業(yè)績(jī),股東應(yīng)占溢利4373萬港元 同比增加23.11%
- (2023-08-30)遼寧省防指啟動(dòng)防汛Ⅳ級(jí)應(yīng)急響應(yīng)!這些城市可能發(fā)生山洪地質(zhì)災(zāi)害
- (2023-08-30)《JOJO的奇妙冒險(xiǎn) 群星之戰(zhàn) 重制版》新DLC角色 “雷歐·阿帕基”登場(chǎng)
- (2023-08-30)我國擬制定學(xué)前教育法
- (2023-08-30)東部戰(zhàn)區(qū)空軍某場(chǎng)站完成同場(chǎng)多機(jī)種保障任務(wù)
- (2023-08-30)馬上啟用,這里又添一所新學(xué)校!
- (2023-08-30)破敵十萬,威震逍遙,張遼前來報(bào)道!
- (2023-08-30)華圖山鼎(300492.SZ):上半年凈虧損389萬元 同比虧損擴(kuò)大
- (2023-08-30)成都車展:奔馳以“油電并驅(qū)”之勢(shì)打造可持續(xù)豪華出行體驗(yàn)
- (2023-08-30)青海這些公路,計(jì)劃通車時(shí)間確定!
- (2023-08-30)南寧地鐵1元乘車活動(dòng)愛南寧APP操作流程
- (2023-08-30)常州太湖灣音樂節(jié)活死人廠牌幾點(diǎn)結(jié)束?
- (2023-08-30)2023海口購房資格碼個(gè)人可以申請(qǐng)嗎?
- (2023-08-30)禁入!南海部分海域進(jìn)行實(shí)彈射擊訓(xùn)練
- (2023-08-30)太原市最低工資標(biāo)準(zhǔn)的通知