從感知到認知,“知識方程”能否通向強人工智能
2023-08-30 09:22:43 來源:文匯報
人工智能(AI)大模型的誕生,讓2023年成為人類歷史上一個重要年份——通用人工智能元年。這意味著以智能革命為代表的第四次工業(yè)革命已然到來,人類站到了智能時代的門檻上。
【資料圖】
人類所經(jīng)歷的前三次工業(yè)革命,都令人類文明實現(xiàn)了新的飛躍,也對世界格局產(chǎn)生了深遠影響。長遠來看,人工智能在很多方面的智慧能力將可能超過人類,但目前通用人工智能還需邁過多道門檻,才能真正實現(xiàn)強人工智能。
日前,中國科學技術大學知識計算實驗室提出了新的知識模型“知識方程”,并以此為基礎建立新型專家系統(tǒng),通過與深度學習的結合,嘗試突破現(xiàn)有通用人工智能的技術瓶頸。
人工智能(AI)誕生至今只有短短60多年,但其發(fā)展經(jīng)歷了幾度跌宕起伏。近年來,深度學習技術為AI帶來了新的革命,其中包括我們熟悉的AlphaGo、ChatGPT等。
當前AI技術在很多任務上取得了超越人類的成效,包括人臉識別、語音識別、字符識別等,在機器翻譯、問答和醫(yī)療診斷等領域也交出了令人相對滿意的答卷。可以說,AI已經(jīng)邁入能夠大規(guī)模落地應用的階段。
不過,當我們試圖將人工智能再向前推進,就會發(fā)現(xiàn)要克服其現(xiàn)有缺陷,還有待技術模式的創(chuàng)新與突破。
當下大模型面臨4個關鍵缺陷
OpenAI公司推出的ChatGPT是一個AI聊天機器人程序,更是一個人工智能自動生成內(nèi)容(AIGC)的工具。作為一個對話系統(tǒng),ChatGPT具備出色的多功能性,無論是暢聊多種話題、解答數(shù)學題,還是提供禮品選擇建議、制定行程規(guī)劃,都可從容應對。因此,從某種意義上來說,ChatGPT具備了廣泛的應用潛力和靈活性,可以說是一個通用人工智能(AGI)程序。
盡管在某些方面(例如邏輯和語義理解等)的評測表明,ChatGPT并非在所有領域都比現(xiàn)有的最佳模型更強大,但現(xiàn)有的最佳模型可能只是針對特定任務而設計,而ChatGPT則是一個通用模型。
其實,多年前人們就認識到大模型的巨大潛力,但其實際發(fā)展速度仍比預想中快了許多。ChatGPT大模型甫一問世,很快就在應用層面受到極大關注。半年后,中國就涌現(xiàn)出了百余個大模型。
目前,大模型的應用主要分為生成式人工智能(AIGC)、大模型輔助工具、個人智能交互3類。其中,個人智能交互尤其值得關注。任何真正能促進交互的技術和產(chǎn)品都能產(chǎn)生巨大價值。這種交互不僅包括“人—人”(通過機器),也包括“人—機”,甚至包括“機—機”。而人工智能,包括大模型,有望在這方面取得顛覆性突破。
然而,目前大模型的應用之路并不如想象的那么順利。根本原因在于,雖然大模型很強大,但仍然在技術上存在一些關鍵缺陷。
首先,大模型有時會犯事實性錯誤,也就是可靠性問題(俗稱“幻覺”)。例如,它會弄錯詩詞作者。從原理看,大模型的答案選擇基于概率,所以很難保證百分百正確。這一問題在目前許多領域的大模型中都存在,也是大模型面臨的最重要的挑戰(zhàn)之一。
第二,大模型的數(shù)學和邏輯推理能力仍然需要加強。雖然GPT-4在某些考試中表現(xiàn)優(yōu)異,但在面對一些精心設計的邏輯推理問題時,大模型的回答與隨機答案相差無幾。因為在進行深度推理時,即便大模型每一步的預測準確率都高達95%,但是當推理到20步時,最終的準確率將會是0.95的20次方,即不到36%,這是一個無法令人滿意的結果。
第三,大模型的形式語義理解能力有待提升。雖然大模型在一定程度上能夠?qū)崿F(xiàn)語義理解,但要想真正從意義和形式上完全理解語言背后的意義,還有很大的改進空間。
最后,大模型作為一個黑盒模型,存在一些通用弱點。比如,其可解釋性、可調(diào)試的能力較弱等。
通向強人工智能或需另辟蹊徑
大模型開啟了通用人工智能落地應用的窗口。但正如前文所說,技術上的一些關鍵缺陷意味著它與通用強人工智能之間尚有很大距離。要縮短這個距離,至少有兩條不同路徑值得探索。
第一條路徑就是繼續(xù)沿著大模型現(xiàn)有的發(fā)展路線向前走。AI誕生不過60多年,GPT真正開始訓練至今也只有5年。如果讓大模型再發(fā)展5年、50年、500年,它會取得怎樣的進步?這是一個值得思考的問題。
沿著現(xiàn)有技術路線,大模型的發(fā)展在兩個關鍵點上會遇到一定的挑戰(zhàn)。
其一,更多的參數(shù)。參數(shù)量的增加,會讓大模型的能力提升。摩爾定律表明,計算能力每18個月到24個月翻一番,而目前大模型的參數(shù)量正以三四個月翻番的速度增長。因此,計算能力很快會跟不上模型的發(fā)展需求。而且,盡管參數(shù)量呈指數(shù)級增長,但其效果只呈線性增長。
其二,更多的數(shù)據(jù)。優(yōu)質(zhì)訓練數(shù)據(jù)的增加,也會讓大模型的能力提升。然而,GPT-4已經(jīng)利用了大部分目前我們能夠獲取到的高質(zhì)量文本數(shù)據(jù)。因此,可供大模型訓練的數(shù)據(jù)即將達到瓶頸。
所以,要在大模型體系內(nèi)解決這些問題,就需要發(fā)展新的顛覆性技術,來突破結構化信息、陳述性事實、長鏈條推理、深度語義理解等方面遇到的瓶頸。
另一條通往通用強人工智能的路徑則有很大不同。
當前AI正在經(jīng)歷從感知智能向認知智能的范式轉(zhuǎn)變。眾所周知,人類擁有兩套推理系統(tǒng),即直覺思考的快系統(tǒng)和理性思考的慢系統(tǒng)??煜到y(tǒng)是一種底層、快速、下意識、不加思索便可即刻得到結論的推理方式,就像人們在家里閉著眼睛也能找到洗手間的位置;而當我們面對陌生環(huán)境,想要找洗手間時,則需要依賴慢系統(tǒng)進行慎思,這種推理相對較慢、能耗較高,但更精確。
目前的大模型更多涉及到的是快系統(tǒng)層面的推理,慢系統(tǒng)推理能力表現(xiàn)還不佳。所以,人們自然而然就會想到,能否將這兩個系統(tǒng)結合起來。
事實上,上一波AI浪潮就是由專家系統(tǒng)驅(qū)動的。專家系統(tǒng)是一種類似于人類慢系統(tǒng)的推理方式,它以符號的方式把專家的知識輸入機器,再通過自動推理,使得機器能夠像專家一樣自動回答問題。
專家系統(tǒng)與大模型各有所長。前者在精確度、可解釋性、邏輯推理能力、語義理解能力等方面表現(xiàn)更佳,而后者在通用性、泛化性、不確定性知識、學習能力等方面更具優(yōu)勢。因此,專家系統(tǒng)與大模型有機結合,正好可以取長補短,這或是通往通用強人工智能的一條更好路徑。
融合兩大推理系統(tǒng)探索未來智能
中國科學家在專家系統(tǒng)與大模型結合的道路上,已經(jīng)開始了探索。中國科學技術大學知識計算實驗室提出了新的知識模型“知識方程”,在此基礎上建立起新型專家系統(tǒng),并將其與深度學習相融合。
簡言之,知識方程分為建模和知識2個層面。在建模層面,知識方程將領域?qū)ο蠼y(tǒng)一抽象成為個體、概念、算子3類語法元素,它們之間可以相互轉(zhuǎn)換、相互融合。在知識層面,知識方程將所有知識統(tǒng)一表示成為形如“a=b”的知識等式?;谥R方程,我們提出了基于新的數(shù)據(jù)與知識雙輪驅(qū)動的、結合大模型與推理引擎的智能信息系統(tǒng)范式。
隨著ChatGPT等大語言模型的興起,在原有以數(shù)據(jù)庫為核心的信息系統(tǒng)之上,大模型可從暗數(shù)據(jù)庫(文本、圖像、視頻等)中挖掘有效信息,并在一定程度上進行推理與(輔助)決策。
事實上,這是信息系統(tǒng)的一次范式革命。在所有數(shù)據(jù)中,暗數(shù)據(jù)占到絕大部分。傳統(tǒng)的信息系統(tǒng)必須通過一些手段(包括人工、自然語言處理、計算機視覺技術等),將“暗”數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)庫中的“明”數(shù)據(jù)才能使用。這種轉(zhuǎn)換往往由于工程和成本等問題,只能處理暗數(shù)據(jù)中的極小部分。而大模型可以直接基于暗數(shù)據(jù)得以輸出,具有很強的暗數(shù)據(jù)處理能力。
基于大模型的信息系統(tǒng)類似于人類用于直覺思考的快系統(tǒng),能在一定程度上直接基于大數(shù)據(jù)進行推理與決策。但由于大模型目前存在的技術缺陷,在很多應用場景并不能直接滿足應用要求。中科大知識計算實驗室所提出的大模型增強技術,可構建領域本體與知識庫,在此基礎上融合大模型與知識推理引擎,研發(fā)知識數(shù)據(jù)雙驅(qū)動的智能信息系統(tǒng)框架,將思考的快系統(tǒng)與慢系統(tǒng)結合起來。與單純的大模型相比,該框架具有正確性、可靠性、可解釋性、可調(diào)試性等優(yōu)點,能夠顯著提高大模型在各行各業(yè)的應用價值。
除了數(shù)據(jù)庫和暗數(shù)據(jù)庫,該系統(tǒng)還可有效利用知識庫的信息。因此,該框架有望引領大模型之后的又一次信息系統(tǒng)范式革命,也將成為智能信息系統(tǒng)的新形態(tài)。
從應用角度看,通用強人工智能無論在廣度,還是在深度方面,都是現(xiàn)有的大模型技術無法比擬的。從長遠來看,人工智能在很多方面的智慧能力可能會超過人類,不僅是計算、記憶和存儲等基礎智能,還可能包括決策、預測、創(chuàng)新等高階智能。隨著基于計算的大模型和知識推理引擎的不斷發(fā)展,AI也將越來越接近甚至超越人類,這將在極大程度上推動生產(chǎn)力。
(作者為中國科學技術大學教授、知識計算實驗室主任)
關鍵詞:
相關閱讀
- (2023-08-30)從感知到認知,“知識方程”能否通向強人工智能
- (2023-08-30)未來8天,四大生肖福氣享不盡,蓄勢待發(fā),事業(yè)終有所成
- (2023-08-30)靖哥哥別走!屈居亞軍后 Jingg在機場和PRX的隊友們以及教練告別
- (2023-08-30)核污染陰影籠罩下,我們?nèi)绾挝从昃I繆?
- (2023-08-30)“模擬駕駛飛機太好玩了”
- (2023-08-30)航發(fā)動力股東戶數(shù)增加1390戶,戶均持股66.94萬元
- (2023-08-30)浙江杭州臨安區(qū)局(分公司)開展零售客戶幫扶志愿活動
- (2023-08-30)武漢局集團公司:加強值班值守迎戰(zhàn)出伏首輪強降雨
- (2023-08-30)海南表彰一批見義勇為英雄和先進分子
- (2023-08-30)山東省梁山縣總工會聯(lián)合縣心理健康中心舉辦職工心理健康知識講座活動
- (2023-08-30)今日173股公布2023年半年報,93股凈利潤同比增長
- (2023-08-30)兩分鐘了解期權交易中的保證金管理應該注意些什么?
- (2023-08-30)起亞EV5車型內(nèi)飾官圖發(fā)布:多處配實體按鍵,中控臺“棱角分明”
- (2023-08-30)湖北孝感:朱湖糯米這張名片越來越亮
- (2023-08-30)給力!旅客丟失物品 沙灣鐵警火速找回
- (2023-08-30)建業(yè)建榮(01556)發(fā)布中期業(yè)績,股東應占溢利4373萬港元 同比增加23.11%
- (2023-08-30)遼寧省防指啟動防汛Ⅳ級應急響應!這些城市可能發(fā)生山洪地質(zhì)災害
- (2023-08-30)《JOJO的奇妙冒險 群星之戰(zhàn) 重制版》新DLC角色 “雷歐·阿帕基”登場
- (2023-08-30)我國擬制定學前教育法
- (2023-08-30)東部戰(zhàn)區(qū)空軍某場站完成同場多機種保障任務
- (2023-08-30)馬上啟用,這里又添一所新學校!
- (2023-08-30)破敵十萬,威震逍遙,張遼前來報道!
- (2023-08-30)華圖山鼎(300492.SZ):上半年凈虧損389萬元 同比虧損擴大
- (2023-08-30)成都車展:奔馳以“油電并驅(qū)”之勢打造可持續(xù)豪華出行體驗
- (2023-08-30)青海這些公路,計劃通車時間確定!
- (2023-08-30)南寧地鐵1元乘車活動愛南寧APP操作流程
- (2023-08-30)常州太湖灣音樂節(jié)活死人廠牌幾點結束?
- (2023-08-30)2023海口購房資格碼個人可以申請嗎?
- (2023-08-30)禁入!南海部分海域進行實彈射擊訓練
- (2023-08-30)太原市最低工資標準的通知