OpenAI突然發(fā)布GPT-4o mini!更快更便宜,人人免費(fèi)可用
今天起,ChatGPT 正式進(jìn)入「4」時(shí)代。
就在剛剛,OpenAI 官宣推出 GPT-3.5 Turbo 的替代品——GPT-4o mini,顧名思義,這是 GPT-4o 更小參數(shù)量的簡(jiǎn)化版本。
即日起,ChatGPT 的免費(fèi)用戶、Plus 用戶和 Team 用戶都能夠使用 GPT-4o mini。下周,企業(yè)版客戶也將獲得使用 GPT-4o mini 的權(quán)限。
OpenAI 官方表示,「這一變化符合我們讓所有用戶都能享受到 AI 技術(shù)好處的目標(biāo)?!?/p>
主打低成本和快速響應(yīng)能力的 GPT-4o mini 適用于多種應(yīng)用場(chǎng)景。
例如,它可以支持需要連續(xù)或同時(shí)調(diào)用多個(gè)模型的應(yīng)用程序(如同時(shí)調(diào)用多個(gè) API),能夠處理大量上下文信息(如完整的代碼庫或?qū)υ捰涗洠约巴ㄟ^快速實(shí)時(shí)的文本回復(fù)與客戶進(jìn)行互動(dòng)(如客戶服務(wù)聊天機(jī)器人)。
具體來說,GPT-4o mini 目前在 API 中提供了文本和圖像處理功能,后續(xù)還將逐步增加對(duì)視頻和音頻的支持。
該模型能夠處理多達(dá) 128K token 的長(zhǎng)上下文,知識(shí)庫截止日期為 2023 年 10 月份,并且對(duì)非英文內(nèi)容的支持更友好。
從 OpenAI 分享的基準(zhǔn)測(cè)試結(jié)果來看,GPT-4o mini 在推理基準(zhǔn)結(jié)果 MMLU 上得分為 82%,而 Gemini Flash 為 77.9%,此前主打極高性價(jià)比的 Claude Haiku 為 73.8%。
GPT-4o mini 在數(shù)學(xué)推理和編程任務(wù)方面也同樣表現(xiàn)出色,遠(yuǎn)超市場(chǎng)上的其他小型模型。
在 MGSM 數(shù)學(xué)推理能力基準(zhǔn)測(cè)試中,GPT-4o mini 得分達(dá)到了 87.0%,而 Gemini Flash 的得分為 75.5%,Claude Haiku 的得分為 71.7%。
GPT-4o mini 在 HumanEval 基準(zhǔn)測(cè)試中同樣再次展現(xiàn)優(yōu)勢(shì),得分達(dá)到 87.2%,而 Gemini Flash 的得分為 71.5%,Claude Haiku 的得分為 75.9%。
而在多模態(tài)推理 MMMU 中,GPT-4o mini 也表現(xiàn)出色,得分為 59.4%,而 Gemini Flash 得分為 56.1%,Claude Haiku 得分為 50.2%。
尤為顯眼的是,GPT-3.5 Turbo 在這些基準(zhǔn)測(cè)試中的得分均不如 GPT-4o mini,甚至可以說被全面碾壓。此外,GPT-4o mini 在大模型盲測(cè)競(jìng)技場(chǎng) LMSYS 中的表現(xiàn)也要優(yōu)于 GPT-4T 01-25。
除了性能上的增強(qiáng),GPT-4o mini 也化身價(jià)格屠夫,要給 API 市場(chǎng)帶來小小的震撼。@ArtificialAnlys 在 X 上發(fā)布了一些模型的價(jià)格對(duì)比,足以看出其價(jià)位水準(zhǔn):
OpenAI 表示,GPT-4o mini 現(xiàn)在可在 Assistant API、Chat Completions API 和 Batch API 中作為文本和視覺模型使用。
GPT-4o mini 每100 萬輸入 token 價(jià)格為 15 美分,每 100 萬輸出 token 價(jià)格為 60 美分,比 GPT-3.5 Turbo 便宜超過 60%。
也就是說,GPT-4o mini 生成一本 2500 頁的書,價(jià)格只需要 60 美分。
對(duì)于 GPT-4o mini 的到來,OpenAI CEO Sam Altman 在 X 平臺(tái)發(fā)文感慨:
回顧 2022 年,當(dāng)時(shí)世界上最先進(jìn)的模型是 text-davinci-003。與現(xiàn)在的新模型相比,它的性能要差得多。而且,它的使用成本比現(xiàn)在的新模型高出 100 倍。
另外,考慮到模型的安全性問題,OpenAI 還邀請(qǐng)了 70 多位來自社會(huì)心理學(xué)和錯(cuò)誤信息研究等領(lǐng)域的專家對(duì) GPT-4o 的潛在風(fēng)險(xiǎn)進(jìn)行了測(cè)試并根據(jù)反饋結(jié)果進(jìn)行改進(jìn)。
同時(shí)基于這些經(jīng)驗(yàn),OpenAI 還采用一些新的技術(shù)來增強(qiáng)對(duì) GPT-4o mini 越獄攻擊等防御能力,使其在大規(guī)模應(yīng)用中更加安全,也更加穩(wěn)定可靠。
今年以來,國(guó)內(nèi)外掀起了新一輪大模型價(jià)格戰(zhàn),但沒想到的是,OpenAI 也用響應(yīng)速度更快、成本更低的 GPT-4o mini 模型加入了本就亂成一鍋粥的戰(zhàn)局。
Altman 更是將其形容為「towards intelligence too cheap to meter」。
作為 GPT-3.5 Turbo 的免費(fèi)替代品,GPT-4o mini 在性能方面也沒落下,甚至也比同量級(jí)的 Claude 3 Haiku 和 Gemini 1.5 Flash 還要好。 不少網(wǎng)友在體驗(yàn)過后也都給出了一致好評(píng)。
值得一提的是,關(guān)于我們心心念念的 GPT-4o 語音模式,Altman 也透露將在本月晚些時(shí)候到來,屆時(shí) APPSO 將第一時(shí)間跟進(jìn)。