中國初創公司 MiniMax 發佈了三款低成本開源人工智能模型,旨在與 OpenAI 的 ChatGPT 等頂級聊天機器人和其他美國製造的模型競爭。
據《南華早報》報道,在其多式聯運模型發佈幾周前,競爭對手DeepSeek也用自己的開源模型制定了新標準,加劇了大陸科技公司的競爭。
這家阿里巴巴和騰訊支持的初創公司週二發佈了其模型。其中包括 MiniMax-01 大型語言模型 (MML) 籃子,其中包括通用基礎模型、MiniMax-Text-01 和多模式 MiniMax-VL-01。 MiniMax-VL-01 具有視覺功能。
據該公司稱,基礎語言模型在包括解決數學問題在內的評估中表現出與世界領先的人工智能模型相當的能力。在該公司在其微信賬戶上發佈的基準測試中,MiniMax 揭示了該模型的其他功能,包括領域知識、遵循指令的能力以及避免幻覺或事實錯誤。
基準測試還顯示,其新模型的性能與閉源模型相匹配,閉源模型通常被認爲具有業內最先進的功能。支持 Google 的 Gemini、亞馬遜支持的 Anthropic 的 Claude 和 OpenAI 的 ChatGPT 等產品的模型都是閉源的。這些通常在 Chatbot Arena 的排名中處於領先地位,Chatbot Arena 是加州大學伯克利分校研究人員的人工智能基準測試項目。
尤其是 MiniMax-Text-01,其參數大小爲 4650 億個,在 MMLU 和 SimpleQA(衡量模型回答數學問題的能力)等基準測試中,其性能優於 Google 最近發佈的 Gemini 2.0 Flash。
據該公司稱,MiniMax-VL-01 在需要多模態理解的評估方面可與 Anthropic 的 Claude 3.5 Sonnet 相媲美。
幾周前,總部位於杭州的競爭對手 DeepSeek 憑藉其開源 V3 模型席捲了全球科技行業。中國擁擠且快速發展的人工智能市場的競爭日益激烈,迫使行業巨頭和初創公司都陷入了爭奪人工智能霸主地位的激烈競爭中,每隔幾個月就會推出新產品,超越對方。
MiniMax 在競爭激烈的環境中發佈了其型號。繼香港上市的商湯科技於同日發佈新的“統一大模型”之後,也發佈了新型號。
據南華早報報道,專門評估中國車型的 SuperCLUE 基準測試將商湯科技新產品評爲多式聯運車型中的頂級競爭者。
儘管人工智能技術取得了進步,但中國初創企業仍面臨貨幣化挑戰。 字節跳動(其旗下的豆寶是 12 月份最受歡迎的中國聊天機器人)等大型科技公司
另一方面,初創公司需要在雄心勃勃的擴張與維持運營的貨幣化努力之間取得平衡。
MiniMax 及其產品可能仍面臨艱難時期。據英國《金融時報》報道,其配套應用程序 Talkie(其收入的主要貢獻者)自去年底以來已因未具體說明的“技術原因”從美國蘋果應用商店中下架。 Android 應用程序仍可在 Google Play 上訪問。
MiniMax 由中國最大的人工智能公司之一商湯科技的前員工於 2021 年創立。據 Tech Crunch 報道,該公司的產品曾捲入一些小爭議。例如,Talkie 以唐納德·特朗普、埃隆·馬斯克和勒布朗·詹姆斯等公衆人物的化身爲特色,但他們似乎都沒有同意在該應用程序中出現。
廣播雜誌報道稱,MiniMax 的視頻生成器可以生成英國電視頻道的徽標。據該雜誌稱,這表明該公司的模型是根據這些渠道的內容進行訓練的。
除此之外,據報道,這家總部位於上海的初創公司還被中國視頻流媒體服務愛奇藝起訴,指控 MiniMax 未經授權使用愛奇藝的受版權保護的錄音進行訓練。
從零到 Web3 Pro:您的 90 天職業啓動計劃