在2024年的世界人工智能大會(huì)(WAIC)上,階躍星辰正式發(fā)布了其最新成果——Step系列模型,包括萬億參數(shù)語言大模型Step-2、千億參數(shù)多模態(tài)大模型Step-1.5V以及圖像生成大模型Step-1X。這一發(fā)布標(biāo)志著階躍星辰在通用人工智能(AGI)的探索道路上取得了重大進(jìn)展。
萬億參數(shù)與多模融合:攀登AGI高峰的必要條件
關(guān)于實(shí)現(xiàn)AGI的方法,業(yè)內(nèi)一直存在不同的觀點(diǎn)。然而,階躍星辰的創(chuàng)始人姜大昕堅(jiān)信,"萬億參數(shù)"和"多模融合"是成功的關(guān)鍵。他指出,早期的AI技術(shù)在語言、視覺、聲音等領(lǐng)域獨(dú)立發(fā)展,但現(xiàn)在不同模態(tài)開始融合,理解能力和生成能力卻難以同時(shí)實(shí)現(xiàn)。因此,他主張多模態(tài)的理解和生成的統(tǒng)一是實(shí)現(xiàn)AGI的必由之路。
Step系列模型:參數(shù)規(guī)模和多模態(tài)能力的顯著提升
Step系列模型的發(fā)布展示了階躍星辰在參數(shù)規(guī)模和多模態(tài)能力上的突破。其中,Step-2在數(shù)理邏輯、編程、世界知識(shí)、指令跟隨等方面全面逼近GPT-4。Step-1.5V則將圖像理解升級(jí)到視頻理解,并具備了根據(jù)圖像內(nèi)容進(jìn)行高級(jí)推理的能力。而Step-1X圖像生成大模型,支持600M、2B、8B三種參數(shù)量,在多模態(tài)理解和生成的統(tǒng)一技術(shù)上實(shí)現(xiàn)了重要突破。
模型與產(chǎn)品并駕齊驅(qū):構(gòu)建開放的生態(tài)圈
自成立以來,階躍星辰一直堅(jiān)持模型和應(yīng)用產(chǎn)品同步開發(fā)的戰(zhàn)略。他們認(rèn)為模型和產(chǎn)品的關(guān)系如同靈魂和皮囊,希望通過"有趣的靈魂"來賦予產(chǎn)品獨(dú)特的價(jià)值。因此,他們通過自有產(chǎn)品和合作伙伴的共同努力,積極探索大模型的實(shí)際應(yīng)用。例如,他們與上海電影合作,推出了基于AI技術(shù)的《大鬧天宮》互動(dòng)體驗(yàn)產(chǎn)品。
在大模型領(lǐng)域,越來越多的大廠高管選擇創(chuàng)業(yè),成為生成式AI創(chuàng)業(yè)賽道的中堅(jiān)力量。而階躍星辰作為一家由微軟前高管領(lǐng)導(dǎo)的創(chuàng)新企業(yè),始終以實(shí)際行動(dòng)追求AGI的目標(biāo)。他們的Step系列模型和多樣化的產(chǎn)品應(yīng)用,為實(shí)現(xiàn)AGI提供了新的思路和方向。