階躍星辰,在2024年的世界人工智能大會(WAIC)上,正式發(fā)布了其最新的Step系列模型,包括萬億參數(shù)語言大模型Step-2、千億參數(shù)多模態(tài)大模型Step-1.5V以及圖像生成大模型Step-1X。這三款模型的發(fā)布,標(biāo)志著階躍星辰在實現(xiàn)AGI(通用人工智能)的道路上邁出了重要的一步。
出手即王炸:萬億參數(shù)與多模融合
在實現(xiàn)AGI的問題上,業(yè)內(nèi)一直存在不同的聲音。然而,階躍星辰的創(chuàng)始人姜大昕堅信,“萬億參數(shù)”和“多模融合”是攀登AGI這座高峰的必要條件。他認(rèn)為,早期的AI語言、視覺、聲音等不同模態(tài)獨立發(fā)展,而現(xiàn)在不同模態(tài)開始走向融合,但理解能力與生成能力難以同時實現(xiàn)。因此,多模態(tài)理解和生成的統(tǒng)一是實現(xiàn)AGI的關(guān)鍵。
Step系列模型:全面提升與技術(shù)突破
Step系列模型的發(fā)布,展示了階躍星辰在參數(shù)規(guī)模和多模態(tài)能力上的顯著進(jìn)展。其中,Step-2在數(shù)理邏輯、編程、世界知識、指令跟隨等方面體感全面逼近GPT-4。Step-1.5V則從圖像理解升級到視頻理解,并具備了根據(jù)圖像內(nèi)容進(jìn)行各類高級推理任務(wù)的能力。而Step-1X圖像生成大模型,支持600M、2B、8B三種不同的參數(shù)量,在多模態(tài)理解和生成統(tǒng)一技術(shù)路線上實現(xiàn)了重要技術(shù)突破。
模型與產(chǎn)品雙輪驅(qū)動:構(gòu)建開放生態(tài)圈
階躍星辰自成立以來,就堅持同時開發(fā)模型和應(yīng)用產(chǎn)品。他們認(rèn)為,模型和產(chǎn)品的關(guān)系就像是靈魂和皮囊,希望通過“有趣的靈魂”來顯示產(chǎn)品的不同。因此,他們通過自有產(chǎn)品和生態(tài)合作產(chǎn)品的結(jié)合,積極探索大模型的落地應(yīng)用。例如,他們與上海電影合作推出了一款基于AI技術(shù)的《大鬧天宮》互動體驗產(chǎn)品。
在大模型領(lǐng)域,越來越多的大廠高管選擇創(chuàng)業(yè),成為生成式AI創(chuàng)業(yè)賽道的主力軍。而階躍星辰作為一家由微軟前高管領(lǐng)導(dǎo)的創(chuàng)新企業(yè),始終用行動踐行著對AGI的追求。他們的Step系列模型和多樣化的產(chǎn)品應(yīng)用,為實現(xiàn)AGI目標(biāo)提供了新的思路和方向。