阿里發佈AI模型新版本:稱已超越DeepSeek和GPT-4o
鞭牛士報道,1月29日消息,據路透社報道,中國科技公司阿里巴巴週三發佈了其Qwen 2.5 人工智能模型的新版本,據稱該模型超越了備受讚譽的 DeepSeek-V3。
Qwen 2.5-Max 的發佈時間比較特殊,正值農曆新年的第一天,大多數中國人都下班回家與家人團聚。這意味着中國人工智能初創公司DeepSeek 在過去三週的迅速崛起不僅給海外競爭對手帶來了壓力,也給國內競爭對手帶來了壓力。
阿里巴巴雲部門在其官方微信公衆號上發佈的聲明中表示:Qwen 2.5-Max 的表現幾乎全面優於 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B。
他指的是 OpenAI 和 Meta 最先進的開源 AI 模型。
DeepSeek 於 1 月 10 日發佈了基於 DeepSeek-V3 模型的人工智能助手,並於 1 月 20 日發佈了 R1 模型,此舉震驚了硅谷,並導致科技股暴跌。這家中國初創公司據稱低廉的開發和使用成本促使投資者對美國領先人工智能公司的鉅額支出計劃提出質疑。
但DeepSeek 的成功也引發了國內競爭對手競相升級自己的 AI 模型。
DeepSeek-R1 發佈兩天後,TikTok 所有者字節跳動發佈了其旗艦 AI 模型的更新,聲稱該模型在 AIME 中的表現優於微軟支持的 OpenAI 的 o1,AIME 是一項基準測試,用於衡量 AI 模型對複雜指令的理解和響應能力。
這與 DeepSeek 的說法相呼應,即其 R1 模型在多個性能基準測試中可與 OpenAI 的 o1 相媲美。
DEEPSEEK 與國內競爭對手
DeepSeek V3模型的前身DeepSeek-V2在去年5月發佈後,引發了國內AI模型價格戰。
DeepSeek-V2 是開源的,而且價格空前便宜,每 100 萬個代幣(或 AI 模型處理的數據單位)僅需 1 元人民幣(0.14 美元),這促使阿里巴巴的雲部門宣佈將多款型號的價格下調高達 97%。
其他中國科技公司也紛紛效仿,包括百度。該公司於 2023 年 3 月發佈了中國首個 ChatGPT 版本,以及中國市值最高的互聯網公司騰訊。
DeepSeek 的神秘創始人樑文峰7 月在接受中國媒體 Waves 的罕見採訪時表示,這家初創公司並不關心價格戰,實現 AGI(通用人工智能)纔是其主要目標。
OpenAI 將 AGI 定義爲在大多數具有經濟價值的任務上超越人類的自主系統。
儘管阿里巴巴等中國大型科技公司擁有數十萬名員工,但 DeepSeek 的運作方式就像一個研究實驗室,主要由來自中國頂尖大學的年輕畢業生和博士生組成。
樑在 7 月份的採訪中表示,他認爲中國最大的科技公司可能不太適合人工智能行業的未來,並將其高昂的成本和自上而下的結構與 DeepSeek 精益的運營和鬆散的管理風格進行了對比。
他說:大型基礎模型需要持續創新,科技巨頭的能力是有限的。