大模型之爭,進(jìn)入關(guān)鍵時刻。
2024年,字節(jié)跳動旗下的豆包大模型實現(xiàn)了逆襲,憑借“更強(qiáng)模型、更低成本、更易落地”的打法迅速出圈。
以至于,資本熱捧“豆包概念”,賺足了2.2億股民的眼球。
特別是火山引擎Force冬季大會之后,豆包大模型全面升級,從感知信息走向感知世界,“豆包概念”一躍成為A股最靚的仔,引得字節(jié)跳動官方出面發(fā)布過度炒作的風(fēng)險提示。
不難看出,豆包大模型正在成為大模型時代的“抖音”。
更強(qiáng)模型,嶄露頭角并非偶然
豆包大模型,上演了一場后發(fā)先至的好戲。
2020年5月15日,豆包大模型才正式下場,雖然姍姍來遲,卻迅速打開了局面,成為大模型賽道最大的“黑馬”。
關(guān)于此,從豆包的使用數(shù)據(jù),就可見一斑。
官方資料顯示,豆包大模型5月的日均tokens使用量為1200億,到了12月日均tokens使用量超過4萬億,增長超過33倍。
而在2024年11月的AI產(chǎn)品全球月活躍排行榜上,豆包APP的MAU高達(dá)5998萬,僅次于OpenAI的ChatGPT,位居全球第二。
之所以如此,與模型能力強(qiáng)悍息息相關(guān)。
在權(quán)威機(jī)構(gòu)智源研究院的最新評測中,豆包大模型在重點(diǎn)考察語言模型中文能力的主觀評測中排名第一,在多模態(tài)的視覺理解、視頻生成、圖像生成三個賽道均排名全球第二。
以豆包用戶青睞的AI語音為例,豆包大模型在ASR和超自然的TTS音色上下了狠功夫,通過超擬人達(dá)到類似和真人對話的效果,從而有了差異化競爭力。
豆包戰(zhàn)略研究負(fù)責(zé)人周昊表示:“英語口語練習(xí)是大家很喜歡的教育場景。用戶反饋說,豆包的發(fā)音、詞匯量、句型都遠(yuǎn)遠(yuǎn)超過他自己。通過豆包實時語音通話功能,和豆包一來一回練英語,毫不尷尬,也省了請老師輔導(dǎo)的開銷?!?/span>
由此可見,豆包大模型嶄露頭角,并非偶然。
這次全面煥新,豆包通用模型pro新版本全面對齊GPT-4o,使用價格僅為后者的1/8;綜合任務(wù)處理能力較5月提升32%,在推理上提升13%,在指令遵循上提升9%,在代碼上提升58%,在數(shù)學(xué)上提升43%,在專業(yè)知識領(lǐng)域能力提升54%。
此外,豆包音樂模型4.0版從生成60秒的片段迭代為生成3分鐘作品,具備制作一首完整音樂的能力;豆包文生圖模型2.1版,首次實現(xiàn)精準(zhǔn)生成漢字和一句話P圖的能力。
簡而言之,豆包大模型的大模型能力更強(qiáng)了,可以滿足更多的復(fù)雜任務(wù)需求以及創(chuàng)新應(yīng)用場景。
一名互聯(lián)網(wǎng)觀察人士告訴鋅刻度:“大模型是一個重資產(chǎn)賽道,考驗企業(yè)在資金、生態(tài)、技術(shù)、人才等方面的底蘊(yùn),Scaling Law之下強(qiáng)者恒強(qiáng)?!?/span>
通俗易懂地說,只要模型能力不斷迭代、不斷變強(qiáng),豆包大模型就可以實現(xiàn)“一步領(lǐng)先,步步領(lǐng)先”。
于是乎,資本市場沸騰了。
機(jī)構(gòu)踏破了“豆包概念”關(guān)聯(lián)的上市公司門檻,單單中科藍(lán)訊一家上市公司,2024年11月以來就累計接待了96家機(jī)構(gòu)調(diào)研。
北京艾文智略投資管理有限公司首席投資官曹轍表示:“豆包的成功是字節(jié)跳動技術(shù)實力和市場定位的體現(xiàn),隨著AI大模型在各領(lǐng)域的應(yīng)用逐漸深入,市場對AI應(yīng)用端的關(guān)注度也將不斷提升?!?/span>
更低成本,技術(shù)創(chuàng)新是關(guān)鍵
更強(qiáng)模型之外,更低成本是豆包大模型彎道超車的另外一個關(guān)鍵因素。
秉持“好的模型就是要讓每一家企業(yè)都用得起”的理念,豆包大模型上線之初,就將通用模型的行業(yè)定價降低了99%,拉開了大模型集體降價的序幕。
如此一來,豆包大模型走上了“高質(zhì)低價”之路,成功占領(lǐng)用戶的心智。
嘗到甜頭之后,豆包大模型在新上架的視覺理解模型上,再次祭出降價打法:每千tokens的價格為0.003元,比行業(yè)平均定價低了85%,相當(dāng)于一塊錢可以處理284張720P的圖片;同時,火山引擎額外提供更高的初始流量,RPM達(dá)到了15000次,TPM達(dá)到120萬。
這意味著,繼通用模型之后,豆包大模型推動視覺理解也進(jìn)入了“厘時代”。
需要注意的是,價格戰(zhàn)并非豆包大模型的本意,只是技術(shù)創(chuàng)新帶來的結(jié)果,是一個正反饋的良性循環(huán)。
抖音集團(tuán)副總裁李亮表示:“豆包大模型通過技術(shù)創(chuàng)新來降低成本,在算法、軟件工程和硬件方案上做了非常多優(yōu)化,3厘/千tokens的定價也有可觀的毛利,而且這是一步到位的透明價格,并不是‘刊例價+折扣’的玩法?!?/span>
事實上,技術(shù)降本一直是豆包大模型的底色。
譬如,新一代的火山引擎GPU實例,通過vRDMA 網(wǎng)絡(luò),支持大規(guī)模并行計算和P/D分離推理架構(gòu),顯著提升訓(xùn)練和推理效率,降低成本。
再譬如,新推出的EIC彈性極速緩存,能夠?qū)崿F(xiàn)GPU直連,使大模型推理時延降低至1/50;成本降低20%。
這么一來,豆包大模型才有了推動價格普惠的底氣。
火山引擎總裁譚待表示:“企業(yè)之所以用豆包更多,還是因為使用體驗較好,而不是沒有嘗試過其他的產(chǎn)品。這個市場就是要充分競爭,最關(guān)鍵的是能不能把自己的東西做好,能不能把成本做低,能不能把方案的落地應(yīng)用性做好?!?/span>
換而言之,豆包大模型推崇的是良性競爭。
“對于企業(yè)級市場來說,商業(yè)模式是建立在可持續(xù)發(fā)展的基礎(chǔ)上,任何商品必須是盈利的,不能靠補(bǔ)貼來降價。如果降價是虧損的,規(guī)模越大虧得越多,這就不是合理的商業(yè)模式。”譚待如是說。
良性競爭之下,視覺理解進(jìn)入大浪淘沙階段,由于門檻降低令更多開發(fā)者涌入,刺激更多的應(yīng)用創(chuàng)新,從而催生繁榮的AICG生態(tài)。
出國旅游,可以快速看懂外文的菜單、標(biāo)簽、指示牌、滾動顯示,可以識別著名地標(biāo)建筑的背景知識等;家庭輔導(dǎo),可以快速批改作文寫得好不好,可以數(shù)學(xué)題做得判斷對錯等;網(wǎng)購求知,可以拍照找同款快速進(jìn)入相關(guān)的推薦界面……
以上可見,視覺理解可以全面賦能應(yīng)用場景,進(jìn)一步加速大模型落地。
更易落地,打通“最后一公里”
更低成本之外,更易落地是豆包大模型另外一個核心競爭力。
公開資料顯示,豆包大模型已經(jīng)與八成主流汽車品牌合作,汽車行業(yè)日均tokens消耗增長了50倍,穩(wěn)坐汽車行業(yè)大模型服務(wù)商第一梯隊;接入到多家手機(jī)、PC等智能終端,覆蓋終端設(shè)備約3億臺,來自智能終端的豆包大模型調(diào)用量在半年時間內(nèi)增長100倍。
此外,一個好漢三個幫,豆包大模型落地離不開HiAgent、扣子、火山方舟三大平臺的支持,借此第三方企業(yè)才可以快速提升AI能力與AI應(yīng)用開發(fā)效率。
以HiAgent為例,定位為低代碼平臺,大幅降低了基于大模型開發(fā)AI應(yīng)用的門檻,擴(kuò)大了受眾范圍,加速AI普惠。
火山引擎副總裁張鑫表示:“如果把豆包大模型比作 Android,那么HiAgent就是企業(yè)調(diào)度系統(tǒng)能力開發(fā)應(yīng)用的SDK(軟件開發(fā)工具包)?!?/span>
通俗易懂地說,開發(fā)者可以像拼樂高一樣搭建AI應(yīng)用。
此背景下,HiAgent上線7個月,成為火山引擎增長最快的企業(yè)服務(wù)產(chǎn)品之一,客戶涉及華泰*券、寧德時代、浙江大學(xué)等不同領(lǐng)域的佼佼者。
更為重要的是,迭代至1.5版之后,HiAgent提供100種行業(yè)的開發(fā)“樣板間”,企業(yè)一鍵復(fù)刻,可以使用模板輕而易舉地開發(fā)AI應(yīng)用。
由此一來,解決了低代碼平臺“專業(yè)客戶看不上,小白客戶不會用”的傳統(tǒng)痛點(diǎn)。
一名業(yè)內(nèi)人士告訴鋅刻度:“業(yè)務(wù)端與開發(fā)端往往需要深度溝通與反復(fù)交流,不然容易出現(xiàn)功能不完整、需求不匹配等情況,低代碼平臺可以讓業(yè)務(wù)端直接上手開發(fā),省去煩瑣的中間過程,開發(fā)端也可以將工作重心轉(zhuǎn)向非標(biāo)應(yīng)用”。
另外,扣子平臺擁有100萬個活躍開發(fā)者,發(fā)布超過200萬個智能體;火山方舟的全域AI搜索,將企業(yè)的信息、業(yè)務(wù)和用戶需求緊密結(jié)合,幫助企業(yè)實現(xiàn)“發(fā)現(xiàn)更多,推薦更準(zhǔn),搜索無限可能”。
值得一提的是,豆包大模型也在對內(nèi)賦能。
這其中,AIGC應(yīng)用即夢表現(xiàn)得可圈可點(diǎn),借助其制作的科幻短劇《覺醒》,成為首部單日點(diǎn)贊破40萬的AI短劇。
工信部信息通信經(jīng)濟(jì)專家委員會委員盤和林在接受媒體采訪時表示:“即夢AI目前在國內(nèi)(視頻)生成領(lǐng)域,還是比較領(lǐng)先的?!?/span>
這意味著,即夢大大降低了短劇的創(chuàng)作門檻以及影視創(chuàng)作的試錯成本。
總而言之,豆包大模型采用高舉高打的策略,圍繞“數(shù)據(jù)、場景、生態(tài)”全面迭代,一躍成為大模型時代的領(lǐng)先者。
因此,豆包大模型有了更大的盼頭。