智東西9月13日消息,OpenAI新模型無(wú)預(yù)警上新:o1系列,可以進(jìn)行通用復(fù)雜推理,每次回答要花費(fèi)更長(zhǎng)時(shí)間思考。
在解決博士水平的物理問(wèn)題時(shí),GPT-4o還是“不及格”59.5分,o1一躍來(lái)到“優(yōu)秀檔”,直接干到92.8分!
沒(méi)錯(cuò),傳說(shuō)中的草莓終于來(lái)與大家見(jiàn)面了!
CEO奧特曼稱它是一種新范式的開(kāi)始:可以進(jìn)行通用復(fù)雜推理的人工智能。從今天開(kāi)始,o1-preview在ChatGPT中會(huì)向所有Plus和Team用戶推出,并且在API中向tier 5開(kāi)發(fā)者推出。
同時(shí),OpenAI還發(fā)布了o1-mini——一種經(jīng)濟(jì)高效的推理模型,非常擅長(zhǎng)STEM,尤其是數(shù)學(xué)和編碼。
具體來(lái)說(shuō),o1系列是OpenAI首個(gè)經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的模型,在輸出回答之前,會(huì)在產(chǎn)生一個(gè)很長(zhǎng)的思維鏈,以此增強(qiáng)模型的能力。
換句話說(shuō),內(nèi)部思維鏈越長(zhǎng),o1思考得越久,模型在推理任務(wù)上的表現(xiàn)就越好。
o1有多強(qiáng)呢?CEO奧特曼直給了答案:在剛剛結(jié)束的2024 IOI信息學(xué)奧賽題目中,o1的微調(diào)版本在每題嘗試50次條件下取得了213分,屬于人類選手中前49%的成績(jī)。如果允許它每道題嘗試10000次,就能獲得362.14分,高于金牌選手門(mén)檻,可獲得金牌。另外它還在競(jìng)爭(zhēng)性編程問(wèn)題 (Codeforces) 中排名前89%,在美國(guó)數(shù)學(xué)奧林匹克 (AIME) 預(yù)選賽題目中躋身美國(guó)前500名學(xué)生之列。
來(lái)源:第一電動(dòng)網(wǎng)
作者:王宇寧
本文地址:http://ewshbmdt.cn/news/jishu/245976
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。