階躍星辰姜大昕：Scaling Law仍處于陡峭區(qū)間，萬億參數(shù)是基本出發(fā)點(diǎn)

2024-07-11 16:41:54 來源：信息

在2024世界人工智能大會(huì)啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇上，階躍星辰創(chuàng)始人、CEO姜大昕發(fā)表了演講，分享了對(duì)于大模型發(fā)展現(xiàn)狀與趨勢的觀察與思考。在演講中，姜大昕重點(diǎn)闡述了一個(gè)核心觀點(diǎn)：探索AGI路徑，“Scaling Law”和“多模態(tài)”是相輔相成、缺一不可的兩個(gè)方向。兩者齊頭并進(jìn)，最終到達(dá)AGI。

近年來，GPT系列模型的演進(jìn)，客觀上驗(yàn)證了Scaling Law的有效性。模型參數(shù)量決定模型能力的上限。從模型效果看，參數(shù)量增大確實(shí)帶來了性能上的飛躍。雖然業(yè)內(nèi)圍繞“Scaling Law還能走多遠(yuǎn)”尚未形成共識(shí)，但階躍星辰認(rèn)為，參數(shù)量接下來再提高一個(gè)數(shù)量級(jí)是依然成立的。Scaling Law 目前依然奏效，模型性能仍然在隨著參數(shù)量、數(shù)據(jù)量和計(jì)算量的增加呈冪次方增長。在此發(fā)展過程中，萬億參數(shù)量已經(jīng)成為一個(gè)基本的入門門檻。

正是基于這樣的認(rèn)知，階躍星辰很早便啟動(dòng)了萬億參數(shù)模型的訓(xùn)練。從千億到萬億，模型的參數(shù)規(guī)模提升了一個(gè)量級(jí)，難度也提升了十倍以上。為此，階躍星辰加大資源投入，尤其在系統(tǒng)和算法上積極探索，最終走通了萬億參數(shù) MoE 大模型訓(xùn)練的道路。在 WAIC 2024 上，階躍星辰發(fā)布了全新的 Step-2 萬億參數(shù)語言大模型正式版。根據(jù)從邏輯推理、世界知識(shí)、數(shù)學(xué)和編程等多個(gè)維度進(jìn)行的權(quán)威測試，Step-2 模型能力都已全面接近國際主流模型，在部分測試集甚至實(shí)現(xiàn)了超越。

延伸閱讀

專題推薦

文化地標(biāo)里的新重慶

聚焦2024全國兩會(huì)

聚焦?jié)竦亍?024年重

奉節(jié)：高揚(yáng)思想之旗

關(guān)于我們 | 網(wǎng)站聲明 | 意見反饋 Copyright2011-2017 All Rights Reserved 農(nóng)家科技、城鄉(xiāng)統(tǒng)籌發(fā)展網(wǎng) 版權(quán)所有
主管單位：重慶出版集團(tuán) 主辦單位：重慶農(nóng)家科技雜志社有限公司城鄉(xiāng)統(tǒng)籌發(fā)展研究中心
協(xié)辦單位：重慶市發(fā)改委、重慶市城鄉(xiāng)統(tǒng)籌辦、重慶市教育委員會(huì)
增值電信業(yè)務(wù)經(jīng)營許可證：渝B2-20170014 網(wǎng)絡(luò)出版服務(wù)許可證:網(wǎng)出證（渝）字第002號(hào) 網(wǎng)絡(luò)文化經(jīng)營許可證:渝網(wǎng)文（2016）4551-030號(hào)
渝公網(wǎng)安備50010802001019號(hào) 互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號(hào)：50120180006 渝ICP備10015940號(hào)-1 技術(shù)支持：城鄉(xiāng)統(tǒng)籌發(fā)展網(wǎng)

階躍星辰姜大昕：Scaling Law仍處于陡峭區(qū)間，萬億參數(shù)是基本出發(fā)點(diǎn)

階躍星辰姜大昕：Scaling Law仍處于陡峭區(qū)間，萬億參數(shù)是基本出發(fā)點(diǎn)