階躍星辰姜大昕：“Scaling Law”和“多模態(tài)”齊頭并進，攀登AGI山峰

2024-07-11 16:42:19 來源：信息

2024世界人工智能大會啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇今天舉行。階躍星辰創(chuàng)始人、CEO 姜大昕博士受邀出席此次論壇，發(fā)表了主題為《攀登AGI的路徑與實踐：萬億參數(shù)和多模融合》的演講，分享了對于大模型發(fā)展現(xiàn)狀與趨勢的觀察與思考。在演講中，姜大昕重點闡述了一個核心觀點：探索AGI路徑，“Scaling Law”和“多模態(tài)”是相輔相成、缺一不可的兩個方向。兩者齊頭并進，最終到達AGI。

Scaling Law仍處于陡峭區(qū)間，萬億參數(shù)是基本出發(fā)點

近年來，GPT系列模型的演進，客觀上驗證了Scaling Law的有效性。模型參數(shù)量決定模型能力的上限。從模型效果看，參數(shù)量增大確實帶來了性能上的飛躍。雖然業(yè)內(nèi)圍繞“Scaling Law還能走多遠”尚未形成共識，但階躍星辰認為，參數(shù)量接下來再提高一個數(shù)量級是依然成立的。Scaling Law 目前依然奏效，模型性能仍然在隨著參數(shù)量、數(shù)據(jù)量和計算量的增加呈冪次方增長。在此發(fā)展過程中，萬億參數(shù)量已經(jīng)成為一個基本的入門門檻。

正是基于這樣的認知，階躍星辰很早便啟動了萬億參數(shù)模型的訓練。從千億到萬億，模型的參數(shù)規(guī)模提升了一個量級，難度也提升了十倍以上。為此，階躍星辰加大資源投入，尤其在系統(tǒng)和算法上積極探索，最終走通了萬億參數(shù) MoE 大模型訓練的道路。在 WAIC 2024 上，階躍星辰發(fā)布了全新的 Step-2 萬億參數(shù)語言大模型正式版。根據(jù)從邏輯推理、世界知識、數(shù)學和編程等多個維度進行的權(quán)威測試，Step-2 模型能力都已全面接近國際主流模型，在部分測試集甚至實現(xiàn)了超越。

多模態(tài)是構(gòu)建世界模型的基礎(chǔ)能力，將走向理解與生成的統(tǒng)一

在不斷攀登Scaling Law的同時，階躍星辰也強調(diào)，多模態(tài)是構(gòu)建世界模型的基礎(chǔ)能力，是通向AGI的必經(jīng)之路。從算法角度看，世界模型的演進會分為三個階段：

第一階段是模擬物理世界;

第二階段是通過具身智能和物理世界交互，主動探索物理世界;

第三階段是通過發(fā)展系統(tǒng)能力，發(fā)現(xiàn)新的物理規(guī)律，歸納物理世界。

從模擬世界，到探索世界，再到歸納世界，多模態(tài)是貫穿這三個階段的基本能力。目前，全球科技巨頭正在積極探索并布局多模融合的路徑，多模態(tài)大模型研發(fā)的腳步正越走越快。然而，多模態(tài)領(lǐng)域目前存在的問題是，視覺的理解模型和生成模型是分開發(fā)展的。其造成的結(jié)果就是理解模型的理解能力強而生成能力弱，或者生成模型的生成能力強而理解能力弱。因此，多模態(tài)大模型接下來面臨的一項關(guān)鍵挑戰(zhàn)，就是能否將理解和生成統(tǒng)一在一個模型里。

目前，階躍星辰正在朝著這個方向努力，并取得了一些階段性的進展。在 WAIC 2024上，新升級的Step-1.5V千億參數(shù)多模態(tài)大模型性能大幅提升，具備更出色的視頻理解能力;新發(fā)布的Step-1X圖像生成大模型，則是階躍星辰首次推出多模態(tài)生成大模型。

在演講的最后，姜大昕總結(jié)到，從千億參數(shù)到萬億參數(shù)，從文本到多模，從多模理解到多模生成，標志著階躍星辰在短時間內(nèi)連續(xù)攀登上大模型的多個臺階，打造了行業(yè)領(lǐng)先的通用大模型矩陣。未來，基于強大的模型能力，階躍星辰期待與眾多領(lǐng)域的行業(yè)頭部企業(yè)深度合作，共同探索積累大模型場景落地的經(jīng)驗，并為合作伙伴提供更多的價值。

階躍星辰姜大昕：“Scaling Law”和“多模態(tài)”齊頭并進，攀登AGI山峰

階躍星辰姜大昕：“Scaling Law”和“多模態(tài)”齊頭并進，攀登AGI山峰