微軟推出微型AI自動(dòng)編碼模型phi-1,擊敗 GPT-3.5
2023-06-26 14:16:39 來源:站長之家
編程客棧()6月26日 消息:微軟的人工智能研究人員發(fā)布了一種新的、輕量級(jí)的代碼生成模型 phi-1,并且其性能優(yōu)于 ChatGPT 背后的大型語言模型 GPT-3.5。
據(jù)了解, 這個(gè)基于 Transformer 的模型僅擁有13億個(gè)參數(shù),相比之下,Codex擁有120億個(gè)參數(shù)。
微軟的研究人員僅用了四天時(shí)間就使用 Nvidia 的8個(gè) A100芯片來訓(xùn)練 phi-1。該模型使用來自網(wǎng)絡(luò)的60億個(gè)token以及使用 GPT-3.5生成的另外10億個(gè)token進(jìn)行訓(xùn)練。
(資料圖片僅供參考)
在性能方面,phi-1在HumanEval基準(zhǔn)測(cè)試中獲得了50.6% 的 pass@1準(zhǔn)確率。盡管模型小得多,但微軟模型擊敗了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S 編程客棧(37.6% ) 。
在MBPP pass@1測(cè)試中,phi-1表現(xiàn)更好,取得了55.5% 的分?jǐn)?shù)。上述許多模型尚未發(fā)布該基準(zhǔn)測(cè)試的結(jié)果,但 WizardLM 的WizardCoder在本月早些時(shí)候進(jìn)行的測(cè)試中得分為51.5%。WizardCoder 是一個(gè)150億個(gè)參數(shù)模型,而 phi-1的參數(shù)模型為13億個(gè)。
高質(zhì)量數(shù)據(jù)帶來差異
微軟的研究人員認(rèn)為,正是“高質(zhì)量數(shù)據(jù)的力量”讓 phi-1表現(xiàn)如此出色。為了說明這一點(diǎn),研究人員將他們模型的論文js命名為“教科書就是你所需要的”。
他們寫道:“正如一本全面、精心制作的教科書可以為學(xué)生提供掌握新學(xué)科所需的知識(shí)一樣,我們的工作展示了高質(zhì)量數(shù)據(jù)在磨練語言模型在代碼生成任務(wù)中的熟練程度方面的顯著影響?!?。
“通過制作‘教科書質(zhì)量’數(shù)據(jù),我們能夠訓(xùn)練出一個(gè)模型,盡管模型大php小縮小了10倍,數(shù)據(jù)集大小縮小了100倍,但在編碼基準(zhǔn)(例如 HumanEval 和 MBPP)上,該模型超越了幾乎所有開源模型?!?/p>
與其他可用的編碼模型相比,Phi-1僅限于 python 編javascript碼。他們表示,該模型的局限性還在于它缺乏大型模型的特定領(lǐng)域知識(shí),例如使用特定 API 進(jìn)行編程。
為了擴(kuò)展他們的工作,微軟的研究人員建議使用 GPT-4而不是 GPT-3.5來生成用于模型訓(xùn)練的合成數(shù)據(jù)。
研究人員還將尋求提高數(shù)據(jù)集的多樣性和非重復(fù)性,盡管該團(tuán)隊(duì)表示,他們必須找到方法“在數(shù)據(jù)生成過程中注入隨機(jī)性和創(chuàng)造力,同時(shí)仍然保持示例的質(zhì)量和連貫性。”
關(guān)鍵詞:
相關(guān)閱讀
- (2023-06-26)微軟推出微型AI自動(dòng)編碼模型phi-1,擊敗 GPT-3.5
- (2023-06-26)【環(huán)球播資訊】2023民用航空行業(yè)市場(chǎng)深度調(diào)研及投資分析
- (2023-06-26)工商銀行兔年金條100g價(jià)格今天多少一克(2023年06月26日)
- (2023-06-26)快播:三菱日聯(lián)金融集團(tuán)(MUFG.US)將以4.67億美元收購印尼汽車貸款提供商Mandala Finance
- (2023-06-26)文天祥次子的下落-熱聞
- (2023-06-26)彩金群英會(huì)金幣價(jià)格今天多少一克(2023年06月26日)
- (2023-06-26)超帥氣的甲斗系列食玩新玩具官方補(bǔ)完假面騎士鋼斗的最終形態(tài) 當(dāng)前視點(diǎn)
- (2023-06-26)皖能電力投資新設(shè)儲(chǔ)能技術(shù)公司 注冊(cè)資本3.2億 天天新要聞
- (2023-06-26)購物中心運(yùn)營市場(chǎng)前景及現(xiàn)狀分析2023|天天實(shí)時(shí)
- (2023-06-26)全球最新:蘋果 iMac 終于要更新了,30 英寸大屏幕 + M3 系列芯片
- (2023-06-26)當(dāng)前最新:《暗黑破壞神4》感知到的威脅任務(wù)攻略
- (2023-06-26)環(huán)球新動(dòng)態(tài):新華網(wǎng)評(píng):遏制網(wǎng)暴,要?jiǎng)x住動(dòng)輒讓人“社死”的歪風(fēng)
- (2023-06-26)歌爾股份:可為客戶提供包括VR/MR光學(xué)透鏡、光學(xué)模組等在內(nèi)精密光學(xué)零組件產(chǎn)品解決方案 世界熱推薦
- (2023-06-26)天天快播:在支付寶網(wǎng)站如何注冊(cè)企業(yè)賬戶 支付寶怎么注冊(cè)企業(yè)
- (2023-06-26)熱議:涉嫌信披違規(guī),新潮能源因信披違規(guī)收警示函
- (2023-06-26)讓科研人員大膽探索(創(chuàng)新談)
- (2023-06-26)環(huán)球滾動(dòng):司法部:準(zhǔn)予5家外國律師事務(wù)所在華設(shè)立代表處
- (2023-06-26)6.26午評(píng)|躺槍了!
- (2023-06-26)微pe工具箱沒有瀏覽器解決方法_焦點(diǎn)短訊
- (2023-06-26)華鑫證券:給予錫業(yè)股份買入評(píng)級(jí)|天天看熱訊
- (2023-06-26)仕凈科技(301030):該股換手率大于8%(06-26)
- (2023-06-26)聯(lián)合水務(wù)(603291)盤中異動(dòng) 股價(jià)振幅達(dá)8.39% 上漲6.57%(06-26) 環(huán)球速看
- (2023-06-26)行業(yè)風(fēng)向標(biāo)丨政策刺激新型儲(chǔ)能加快發(fā)展,行業(yè)需求有望迎來高增_今日關(guān)注
- (2023-06-26)彩金猴王出世金幣價(jià)格今天多少一克(2023年06月26日)
- (2023-06-26)2023癸卯年150克方形金幣價(jià)格(2023年06月26日)-實(shí)時(shí)
- (2023-06-26)“探營”天津夏季達(dá)沃斯論壇會(huì)場(chǎng) 亮點(diǎn)多多期待滿滿
- (2023-06-26)天天播報(bào):鐵路端午小長假運(yùn)輸發(fā)送旅客7037.9萬人次 較2019年同期增長11.3%
- (2023-06-26)全球熱頭條丨北京油車搖號(hào)結(jié)果出爐:超六成指標(biāo)被“無車家庭”搖中 概率高于個(gè)人
- (2023-06-26)兔年生肖150克銀幣價(jià)格(2023年06月26日)-熱點(diǎn)
- (2023-06-26)身份證和檔案年齡不一致,退休時(shí)按哪個(gè)計(jì)算?最新解答來了