在備受矚目的WAIC 2024世界人工智能大會(huì)上,中國(guó)新興的AI明星企業(yè)階躍星辰階躍星辰首發(fā)了三款 Step 系列通用大模型新品:Step-2 萬(wàn)億參數(shù)語(yǔ)言大模型正式版、Step-1.5V 多模態(tài)大模型、Step-1X 圖像生成大模型。這是自今年三月正式亮相以來(lái),階躍星辰團(tuán)隊(duì)在短短 100 天左右達(dá)成的突破,實(shí)現(xiàn)了從千億參數(shù)到萬(wàn)億參數(shù),從語(yǔ)言模型到多模態(tài)模型,從理解到生成的全面進(jìn)步。
階躍星辰于 2023 年 4 月成立,以“智能階躍,十倍每一個(gè)人的可能”為使命,以實(shí)現(xiàn)通用人工智能為目標(biāo)。階躍星辰的創(chuàng)始人和 CEO 是前微軟全球副總裁,微軟亞洲互聯(lián)網(wǎng)工程院首席科學(xué)家姜大昕博士,同時(shí)也是算法負(fù)責(zé)人。核心創(chuàng)始團(tuán)隊(duì)包括系統(tǒng)負(fù)責(zé)人朱亦博博士,擁有多次單集群萬(wàn)卡以上的系統(tǒng)建設(shè)與管理實(shí)踐經(jīng)驗(yàn);數(shù)據(jù)負(fù)責(zé)人焦斌星,此前擔(dān)任微軟必應(yīng)引擎核心搜索團(tuán)隊(duì)負(fù)責(zé)人。公司聚集了來(lái)自微軟、谷歌、字節(jié)、騰訊等公司的頂尖人才。
回顧今年3月23日,階躍在2024全球開(kāi)發(fā)者先鋒大會(huì)上正式亮相并發(fā)布了3款模型,即Step-1千億參數(shù)語(yǔ)言大模型、Step-1V千億參數(shù)多模態(tài)大模型、Step-2萬(wàn)億參數(shù)MoE語(yǔ)言大模型(預(yù)覽版)。7月4日,WAIC 2024大會(huì)現(xiàn)場(chǎng),我們注意到階躍星辰Step家族已經(jīng)得到全面升級(jí)。Step-2萬(wàn)億參數(shù)大模型預(yù)覽版已經(jīng)更新為正式版,企業(yè)和開(kāi)發(fā)者可以通過(guò)階躍星辰開(kāi)發(fā)平臺(tái)申請(qǐng)?bào)w驗(yàn)。
階躍星辰創(chuàng)始人、CEO姜大昕博士介紹,Step-2 萬(wàn)億參數(shù)語(yǔ)言大模型采用了創(chuàng)新的 MoE 混合專(zhuān)家模型架構(gòu),在數(shù)理邏輯、編程、知識(shí)、指令跟隨等方面體感全面逼近國(guó)際主流模型。姜大昕博士認(rèn)為,攀登 AGI 山峰,“萬(wàn)億參數(shù)”和“多模融合”缺一不可。他表示,萬(wàn)億參數(shù)規(guī)模,是實(shí)現(xiàn) AGI 的基礎(chǔ)門(mén)檻;多模態(tài)大模型,是通向 AGI 的必經(jīng)之路。面向未來(lái),階躍星辰將持續(xù)將模型做大做強(qiáng),打造超級(jí)模型,同時(shí)讓模型服務(wù)于工作和生活,十倍每個(gè)人的可能?!?
除了Step-2萬(wàn)億基礎(chǔ)模型的重大突破,階躍星辰最新研發(fā)的多模態(tài)大模型——Step-1.5V也備受關(guān)注,為AI技術(shù)在更多場(chǎng)景的應(yīng)用打開(kāi)了想象空間。
據(jù)了解,階躍星辰Step-1.5V是對(duì)其原有多模態(tài)大模型的全面升級(jí)。相比于之前的版本,Step-1.5V在圖像感知和理解能力上實(shí)現(xiàn)了質(zhì)的飛躍,并具備了出色的視頻理解能力。這意味著,AI技術(shù)不僅可以更好地理解和分析圖像信息,還可以更深入地理解和處理視頻內(nèi)容。
具體而言,Step-1.5V能夠準(zhǔn)確地識(shí)別視頻中的物體、人物和環(huán)境,并理解視頻的整體氛圍與人物情緒。這使得AI技術(shù)在視頻監(jiān)控、智能安防、內(nèi)容審核等領(lǐng)域的應(yīng)用更加精準(zhǔn)和高效。同時(shí),Step-1.5V還能夠根據(jù)圖像內(nèi)容進(jìn)行解答數(shù)學(xué)題、編寫(xiě)代碼、創(chuàng)作詩(shī)歌等高級(jí)推理任務(wù),為AI技術(shù)在教育、編程、藝術(shù)創(chuàng)作等領(lǐng)域的應(yīng)用提供了新的思路。
此外,階躍星辰還發(fā)布了其在圖像生成領(lǐng)域的最新成果——Step-1X圖像生成大模型。該模型采用了全鏈路自研的DiT模型架構(gòu),具備更加強(qiáng)大的語(yǔ)義對(duì)齊和指令跟隨能力,能夠生成更具中國(guó)風(fēng)格和文化特色的圖像內(nèi)容。這為AI技術(shù)在文化傳承、創(chuàng)意設(shè)計(jì)等領(lǐng)域的應(yīng)用開(kāi)辟了新的可能性。
在應(yīng)用落地方面,階躍星辰的多模態(tài)大模型已經(jīng)在多個(gè)領(lǐng)域取得了顯著成果。例如,其與上海報(bào)業(yè)旗下界面財(cái)聯(lián)社合作推出的君弘靈犀大模型,將大模型能力全面融入了客戶智能化服務(wù)體系之中,為客戶帶來(lái)了全新的智能投顧問(wèn)答和投研內(nèi)容生產(chǎn)體驗(yàn);而在內(nèi)容創(chuàng)作領(lǐng)域,階躍星辰聯(lián)合上海電影在“AI+IP”領(lǐng)域進(jìn)行創(chuàng)新探索,雙方圍繞《大鬧天宮》和《葫蘆兄弟》兩款國(guó)民級(jí) IP 進(jìn)行了AI互動(dòng)游戲開(kāi)發(fā)和視頻生成能力的展示。