大模型領(lǐng)域,開源與閉源之爭(zhēng)一直是技術(shù)和產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。阿里云通義千問最新發(fā)布的Qwen2系列模型,為這場(chǎng)爭(zhēng)論提供了最新的答案。
6月7日,通義千問推出開源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整體性能相比Qwen1.5-110B大幅提升!一舉超越了美國(guó)最強(qiáng)的開源模型Llama3-70B,更是將文心4.0等中國(guó)眾多閉源模型甩在身后,登上最強(qiáng)開源大模型的寶座。
此前存在一種觀點(diǎn)認(rèn)為在大模型的開發(fā)上,閉源模型因?yàn)槠潺嫶蟮耐顿Y和資源積累,相較開源模型具有不可比擬的優(yōu)勢(shì),導(dǎo)致了一種看似共識(shí)的觀念:開源模型難以追趕閉源模型的步伐。
單一的公司的閉源模型,如果有大量資金和資源投入,的確可以在短期內(nèi)推動(dòng)技術(shù)的發(fā)展,這一點(diǎn)在OpenAI上已經(jīng)得到了驗(yàn)證。而且不可否認(rèn),選擇閉源的OpenAI在性能上仍然是業(yè)界最強(qiáng)。
而這次阿里云Qwen2的發(fā)布,表明開源模型同樣能夠達(dá)到甚至超越閉源模型的高性能。這不僅讓開源模型落后閉源模型的論調(diào)不攻自破,也再次證明了開源大模型不僅不會(huì)越來越落后,在技術(shù)上更是有著無限的可能。開源大模型能夠做到足夠強(qiáng),并且會(huì)越來越強(qiáng)。
同時(shí)這也是對(duì)開源價(jià)值的再一次闡釋,Qwen系列的開源模型除了為技術(shù)社區(qū)貢獻(xiàn)了一項(xiàng)重要的資源,也鼓勵(lì)了全球性的創(chuàng)新合作,進(jìn)一步強(qiáng)化了開源大模型生態(tài)系統(tǒng)的活力和包容性。
值得一提的是,阿里云在1個(gè)月前剛剛發(fā)布中文場(chǎng)景性能超過GPT-4的閉源模型——通義千問2.5,從這個(gè)角度來看開閉源的路線選擇,阿里云實(shí)際上是兩條腿走路。既利用開源的優(yōu)勢(shì)進(jìn)行廣泛的技術(shù)傳播和創(chuàng)新,又通過閉源的方式保障關(guān)鍵技術(shù)的領(lǐng)先和商業(yè)應(yīng)用的穩(wěn)定。這種類似于雙軌制的策略,使得阿里云能夠在技術(shù)創(chuàng)新和商業(yè)化應(yīng)用中取得平衡,實(shí)現(xiàn)技術(shù)價(jià)值的最大化。
所以,開源與閉源并不矛盾,而是在不同的場(chǎng)景和需求下扮演著各自獨(dú)特的角色,這并不是一道非此即彼的選擇題,也是時(shí)候?yàn)閮烧叩穆肪€之爭(zhēng)畫下休止符了。
事實(shí)上,過去10個(gè)月里,這樣的場(chǎng)景并不是阿里云開源大模型僅有的高光時(shí)刻。據(jù)了解,Qwen系列模型總下載量已突破1600萬次。在全球開源社區(qū)出現(xiàn)了超過1500款基于Qwen二次開發(fā)的模型,Qwen系列的72B、110B模型多次登頂HuggingFace 的Open LLM Leaderboard開源模型榜單,其國(guó)際社會(huì)認(rèn)可度及開發(fā)者好感度可見一斑。
大洋彼岸的Meta試圖用Llama系列一統(tǒng)開源天下,而阿里的通義千問的出現(xiàn)為全球開發(fā)者提供了另一項(xiàng)選擇,也讓我們看到了“國(guó)外一開源,國(guó)內(nèi)就自主”說法的偏頗。市場(chǎng)會(huì)用腳投票,以Qwen為代表的國(guó)內(nèi)開源模型所作出的貢獻(xiàn)被長(zhǎng)期忽視的現(xiàn)狀,一定會(huì)隨著更多全球企業(yè)和開發(fā)者的認(rèn)可,逐漸扭轉(zhuǎn)過來。
開源的Qwen,開放的阿里云
開源與互聯(lián)網(wǎng)的發(fā)展緊密相連,自1970年代Unix和互聯(lián)網(wǎng)問世之初,開源就隨之出現(xiàn)。如果不是開源運(yùn)動(dòng)的推進(jìn),許多技術(shù)仍可能被少數(shù)巨頭企業(yè)所壟斷,阻礙科技普惠程度,我們所見證的科技創(chuàng)新浪潮也將不復(fù)存在。
對(duì)于大模型行業(yè)來說,有了更好的開源模型,才能夠吸引更多人才參與到相關(guān)技術(shù)創(chuàng)新研究中。有了更好的開源模型,更多中小企業(yè)才能真正用上大模型,才會(huì)有更多對(duì)大模型產(chǎn)品應(yīng)用的探索。
阿里云對(duì)開源的堅(jiān)持,本質(zhì)上是相信開放的力量,也就是阿里云CTO周靖人所說,“堅(jiān)持開源開放是阿里云的重要策略,我們希望打造一朵AI時(shí)代最開放的云,讓算力更普惠、讓AI更普及?!边@種堅(jiān)定的開源策略,不僅為技術(shù)創(chuàng)新提供了土壤,也為全球開發(fā)者提供了平臺(tái)。
開放是為了服務(wù)好客戶,阿里云百煉集成了國(guó)內(nèi)外主流優(yōu)質(zhì)大模型,提供模型選型、微調(diào)訓(xùn)練、安全套件、模型部署等服務(wù)和全鏈路的應(yīng)用開發(fā)工具。
開放也是為了生態(tài)的繁榮,把餅做大,才能更好的分餅。在阿里云魔搭社區(qū)上,匯聚了大量開源模型,成為國(guó)內(nèi)開發(fā)者最活躍的AI社區(qū)。
選擇開源還是閉源,不僅是企業(yè)的戰(zhàn)略決策,更會(huì)影響商業(yè)模式。不可否認(rèn)的是大模型的開源存在商業(yè)模式不明朗的問題,比如扎克伯格也一直在評(píng)估自身能否從云服務(wù)廠商使用Llama相關(guān)收入中進(jìn)行分成,畢竟Meta不太可能為了Llama去開辟云計(jì)算業(yè)務(wù)。
而對(duì)阿里云這樣一家提供基礎(chǔ)設(shè)施的云廠商來說,商業(yè)邏輯就十分清晰了。在大模型技術(shù)帶動(dòng)云計(jì)算增量需求,幾乎是一個(gè)確定性趨勢(shì)的背景下,Qwen的開源不需要帶來直接的商業(yè)化收益,而是吸引更多的廠商和開發(fā)者,來使用阿里云打造的基礎(chǔ)設(shè)施,以及包括閉源模型在內(nèi)的相關(guān)服務(wù),從底層的算力基座,到大模型應(yīng)用的構(gòu)建,再到開放的AI生態(tài),從而形成完整的商業(yè)模式。
通過親自下場(chǎng)打造并開源Qwen系列模型,同時(shí)為大模型的落地提供完善的工具和平臺(tái),阿里云走出一條與Meta、微軟、AWS等頂級(jí)玩家不同的道路,這種云+AI的示范效應(yīng),已成為一種行業(yè)標(biāo)準(zhǔn),對(duì)客戶選擇阿里云來探索大模型提供了一種天然的說服力。
這在全球大模型廠商中也是獨(dú)一份。
Qwen是阿里AGI愿景的重要拼圖
在AGI成為科技巨頭們新戰(zhàn)場(chǎng)的當(dāng)下,阿里巴巴清晰地表明了其在這一領(lǐng)域的堅(jiān)定信心和戰(zhàn)略布局。在阿里發(fā)布的2024財(cái)年致股東信中,明確提出電商和云計(jì)算是阿里的兩大核心業(yè)務(wù),并將通過持續(xù)投資保持基礎(chǔ)技術(shù)的領(lǐng)先地位,包括人工智能在內(nèi)的創(chuàng)新。
從技術(shù)發(fā)展的角度來看,AI的進(jìn)步經(jīng)歷了數(shù)次重要的飛躍,已經(jīng)深刻改變了各個(gè)行業(yè)的面貌。云計(jì)算的普及進(jìn)一步加速了AI的發(fā)展,使得大規(guī)模數(shù)據(jù)處理和復(fù)雜模型訓(xùn)練成為可能。在這一歷史背景下,阿里云通過其云計(jì)算基礎(chǔ)設(shè)施和持續(xù)的技術(shù)創(chuàng)新,推動(dòng)了AI技術(shù)的前沿探索,Qwen的領(lǐng)先以及在全球范圍獲得了認(rèn)可,正是阿里云計(jì)算與AI結(jié)合戰(zhàn)略的產(chǎn)物。
從商業(yè)發(fā)展的角度,技術(shù)創(chuàng)新一直是企業(yè)競(jìng)爭(zhēng)力的核心驅(qū)動(dòng)力。阿里云通過將AI與云計(jì)算的深度融合,不僅開辟了在AI時(shí)代的商業(yè)模式,也獲得了持續(xù)增長(zhǎng)的路徑。
在近期與摩根大通的對(duì)話中,阿里巴巴副主席蔡崇信再次表示AI和云計(jì)算的結(jié)合至關(guān)重要,并強(qiáng)調(diào)了阿里對(duì)AGI愿景的堅(jiān)定信念?,F(xiàn)在來看,阿里云已然為這一愿景打造了一塊關(guān)鍵拼圖