這注定是人工智能發(fā)展史上的又一個(gè)標(biāo)志性事件,其影響體現(xiàn)在三個(gè)方面。
剛剛過(guò)去的周末,蘋(píng)果發(fā)表了一篇論文,公布了自己研發(fā)的MM1多態(tài)大語(yǔ)言模型(Multimodal LLM)。這注定是人工智能發(fā)展史上的又一個(gè)標(biāo)志性事件!很遺憾,我不是技術(shù)研發(fā)人員,對(duì)這篇論文只能粗略看懂一些基本信息。我的一些從事大模型研發(fā)的朋友,昨天已經(jīng)徹夜不眠地進(jìn)行深度研究了。
蘋(píng)果這次公布的MM1大模型分為三個(gè)參數(shù)規(guī)模,其中最大的擁有300億參數(shù),與市面上的主流競(jìng)品相比,好像不是很大——要知道,谷歌PaLM大模型擁有5400億參數(shù),OpenAI的GPT-4更是擁有1.7萬(wàn)億參數(shù)(注:OpenAI官方并未披露參數(shù)數(shù)量,僅有外界猜測(cè))??萍疾┛虳aily Dev的評(píng)測(cè)顯示,MM1在GLUE-Score等多項(xiàng)評(píng)測(cè)指標(biāo)上要略?xún)?yōu)于GPT-4V和Gemini Pro;不過(guò)眾所周知,這種評(píng)測(cè)的參考價(jià)值有限。MM1目前還沒(méi)有公測(cè),官方也沒(méi)有公布上線時(shí)間表,要評(píng)估其具體的技術(shù)水平可能還需要很長(zhǎng)一段時(shí)間。
對(duì)于人工智能行業(yè)乃至全球科技行業(yè)而言,MM1大模型本身可能是一件小事,蘋(píng)果由此表現(xiàn)出的姿態(tài)則是一件大事。具體而言:
蘋(píng)果今后肯定會(huì)依賴(lài)自研大模型,而不是OpenAI等第三方的大模型或者開(kāi)源大模型。大模型是一項(xiàng)基礎(chǔ)設(shè)施,沒(méi)有哪個(gè)科技巨頭愿意受制于人,都會(huì)投入盡可能多的資源實(shí)現(xiàn)自主。今后大模型賽道的競(jìng)爭(zhēng)會(huì)更激烈。
根據(jù)蘋(píng)果一貫的作風(fēng),它肯定想實(shí)現(xiàn)“軟件-算法-芯片”三位一體的統(tǒng)一,今后肯定會(huì)建立自己的AI開(kāi)發(fā)社區(qū),甚至在芯片領(lǐng)域挑戰(zhàn)一下英偉達(dá)。AMD和英特爾都沒(méi)有這個(gè)實(shí)力,但蘋(píng)果確實(shí)有一定希望。
在長(zhǎng)期,最值得關(guān)注的話題是:蘋(píng)果會(huì)不會(huì)走邊緣計(jì)算、本地化推理的路線?這將直接決定“AI手機(jī)”有沒(méi)有市場(chǎng)。不過(guò)這個(gè)問(wèn)題不是一兩年內(nèi)能解決的。
先說(shuō)第一條。在ChatGPT剛剛發(fā)布時(shí),業(yè)界的主流觀點(diǎn)是:世界上不需要那么多大模型,可能只需要3-5個(gè),包括1-2個(gè)最先進(jìn)的閉源大模型,再加上幾個(gè)開(kāi)源大模型?,F(xiàn)在的情況卻是人人都想做自己的大模型。此前很長(zhǎng)一段時(shí)間,大家都覺(jué)得蘋(píng)果是一家消費(fèi)電子廠商,沒(méi)有必要押注于自研大模型,只需要租用市面上最先進(jìn)的大模型就可以了?,F(xiàn)實(shí)告訴我們,蘋(píng)果不是這么想的。就像我的一位從事大模型研發(fā)的朋友所說(shuō):“AGI時(shí)代,自己有控制權(quán)的大模型才是最好的。OpenAI不可能將模型參數(shù)開(kāi)放給蘋(píng)果,蘋(píng)果也不會(huì)樂(lè)意受制于微軟生態(tài)。不管它做不做得好,它只能自己做!”
如果蘋(píng)果是這么想的,其他科技巨頭就更會(huì)這么想了。谷歌和亞馬遜都投資了Anthropic(除了OpenAI之外最炙手可熱的AI創(chuàng)業(yè)公司),Salesforce投資了Mistral;各家大廠收購(gòu)的小型研發(fā)團(tuán)隊(duì)就更是數(shù)不勝數(shù)了。無(wú)論這個(gè)世界究竟需要多少大模型,每個(gè)科技巨頭都會(huì)做自己的大模型,而且肯定不止做一個(gè)——內(nèi)部孵化幾個(gè)、外部投資或并購(gòu)幾個(gè),才是常態(tài)。
前一段時(shí)間,市場(chǎng)上有消息稱(chēng),蘋(píng)果從鴻海訂購(gòu)了2萬(wàn)臺(tái)AI服務(wù)器,其中40-50%是英偉達(dá)H100服務(wù)器。當(dāng)時(shí)很多人(包括我在內(nèi))認(rèn)為這些服務(wù)器主要是用來(lái)推理的,不過(guò)用H100推理顯得過(guò)于奢侈了。現(xiàn)在看來(lái),這些服務(wù)器應(yīng)該既包括推理需求、也包括訓(xùn)練需求。蘋(píng)果最不缺的就是錢(qián),既然它決定了押注自研大模型,就一定會(huì)把戰(zhàn)爭(zhēng)打到底。全球AI算力緊缺的局勢(shì)看樣子會(huì)雪上加霜。
再說(shuō)第二條。雖然外界經(jīng)常低估蘋(píng)果的研發(fā)實(shí)力,但是在歷史上,蘋(píng)果經(jīng)常通過(guò)在消費(fèi)產(chǎn)品積累的資源去進(jìn)軍中上游、直至切入核心技術(shù)層面,這一點(diǎn)在民用芯片領(lǐng)域體現(xiàn)的最明顯:自從2021年以來(lái),蘋(píng)果自研的M系列芯片已經(jīng)全面替代英特爾x86芯片,成為Mac電腦的標(biāo)配,乃至被“下放”到了iPad當(dāng)中。一位熟悉這個(gè)領(lǐng)域的朋友告訴我:“蘋(píng)果絕不會(huì)甘愿受制于CUDA。它熱衷于獨(dú)立掌握核心算法,對(duì)自研芯片進(jìn)行適配優(yōu)化,從而實(shí)現(xiàn)芯片-算法-軟件的整合。不過(guò)它一定會(huì)小心謹(jǐn)慎地行事?!?/p>
眾所周知,英偉達(dá)依托CUDA生態(tài),建立了牢不可破的競(jìng)爭(zhēng)壁壘。但是,英偉達(dá)的驅(qū)動(dòng)程序并不開(kāi)源(注:有極少數(shù)開(kāi)源過(guò),但于事無(wú)補(bǔ)),CUDA也并不好用。AMD、英特爾等競(jìng)爭(zhēng)對(duì)手已經(jīng)被甩出太遠(yuǎn)了,依靠它們?nèi)ヌ魬?zhàn)英偉達(dá)并不顯示。蘋(píng)果則擁有這樣的實(shí)力,看樣子也擁有這樣的意愿。不過(guò),就算它決定進(jìn)軍英偉達(dá)的地盤(pán),這個(gè)過(guò)程也會(huì)持續(xù)相當(dāng)漫長(zhǎng)的時(shí)間——要知道,從2006年Mac換用英特爾芯片到2020年轉(zhuǎn)向自研芯片,經(jīng)過(guò)了整整14年!
附帶說(shuō)一句,哪怕英偉達(dá)的競(jìng)爭(zhēng)對(duì)手(無(wú)論是不是蘋(píng)果)成功地奪走了一些市場(chǎng)份額,也不會(huì)解決當(dāng)前AI算力緊缺的問(wèn)題,因?yàn)槠款i主要在制造環(huán)節(jié)。尤其是訓(xùn)練相關(guān)的芯片制造,在未來(lái)很長(zhǎng)一段時(shí)間內(nèi)估計(jì)還是臺(tái)積電的天下。無(wú)論誰(shuí)是AI芯片的王者,它都要依賴(lài)臺(tái)積電代工。這是一個(gè)工程問(wèn)題,只能循序漸進(jìn)地解決。
最后,今后的AI推理主要在云端(數(shù)據(jù)中心)還是終端(手機(jī)、電腦)實(shí)現(xiàn),這是一個(gè)爭(zhēng)議很大的話題。我們看到各家手機(jī)廠商在爭(zhēng)先恐后地推出“AI手機(jī)”——很可惜,這些產(chǎn)品現(xiàn)在還沒(méi)什么用,消費(fèi)者沒(méi)有任何迫切的需求。當(dāng)年的云游戲概念,是希望把游戲算力從終端搬到云端;現(xiàn)在的AI手機(jī)概念,則是希望把推理算力從云端搬到終端。前者已經(jīng)被證明不切實(shí)際(至少現(xiàn)在是如此),后者則前途未卜。
作為全球最大、最賺錢(qián)的智能終端廠商,蘋(píng)果肯定會(huì)希望終端多承擔(dān)一些AI推理職責(zé),這也有助于iOS生態(tài)的進(jìn)一步擴(kuò)張。然而,技術(shù)進(jìn)步不會(huì)以任何科技巨頭的主觀愿望為轉(zhuǎn)移。很多人猜測(cè),蘋(píng)果大模型的研發(fā)方向?qū)⒅赶蜻吘売?jì)算、本地化和小型化,其戰(zhàn)略目標(biāo)是開(kāi)發(fā)出適合在移動(dòng)端本地推理的模型。但是從目前的公開(kāi)信息(主要就是那篇論文)中,我們尚不能獲得足夠的信息。
對(duì)于蘋(píng)果的投資者而言,最大的好消息是:蘋(píng)果注意到了自研大模型的重要性,不甘于在這個(gè)戰(zhàn)略性賽道上掉隊(duì),而且正在試圖利用自身資源稟賦去影響大模型技術(shù)的發(fā)展方向。資本市場(chǎng)可能會(huì)對(duì)此做出良好的反應(yīng)(尤其是考慮到今年以來(lái)蘋(píng)果衰落的股價(jià)),但是能否實(shí)現(xiàn)又是另一回事了。