阿裡雲開源大模型:推動AI生態構建與多場景應用隨著開源模型的大量湧現,其效能已能與當下最領先的閉源模型相媲美。 同時,開源模式有效降低了模型訓練成本,使得最先進的模型得以低成本部署和廣泛應用。
在AI時代浪潮下,阿裡巴巴集團徹底變革了企業發展戰略。
2025年2月24日,阿裡巴巴集團CEO吳泳銘宣佈,未來三年,阿裡計畫投入超3800億元用於全球雲服務及AI硬體基礎設施建設,這一投入遠超公司過去十年在該領域的總和。
在大模型領域,阿裡雲已取得矚目成果。 現時,已開源超200個不同模型,通義千問(Qwen)衍生模型數量在海內外開源社區突破10萬個,超越美國Llama系列模型,穩居全球開源大模型首位。
阿裡雲通義千問團隊向《商學院》雜誌透露,借助開源,阿裡雲致力於打造强大的AI生態系統,助力海量中小企業與AI開發者更早、更便捷地使用通義千問,推動大模型科技普及與落地應用,助力中國大模型生態建設。 因為只有構建穩固的大模型基礎,才能為未來商業化應用創造無限可能。
全面開源推進AI生態構建
自2023年8月起,阿裡雲率先在國內大規模開源大模型系列,成為我國首家大規模開源的大廠,並多次榮獲Chatbot Arena、司南OpenCompass等權威榜單“全球開源冠軍”“國產模型冠軍”稱號。 2024年,僅Qwen2.5-1.5B一款開源模型,就佔據全球最大開源社區Hugging Face模型下載量的26.6%,位居世界第一。
阿裡雲指出,開源能够彙聚全球開發者智慧與力量,相比單個公司獨立研發,能更高效地推動技術創新與反覆運算。 例如,DeepSeek開源R1後,全球掀起複刻R1熱潮,對OpenAI的o1推理模型造成衝擊,推動全球大模型科技邁入推理模型新階段。
此外,開源利於生態系統構建。 開源模式下,任何人皆可免費下載部署AI模型,有力促進新技術普及。 像DeepSeek的六個蒸餾模型中有四個基於千問開源模型; 李飛飛團隊也基於千問開源模型,成功訓練出效能比肩頂尖推理模型的新模型s1-32B,在競賽數學問題上效能較o1-preview高出27%。
再者,開源加速AI產業化進程,促進AI科技在各行業落地。 對於初創企業和中小企業而言,直接使用開源模型可大幅降低進入AI領域的科技與資金門檻,結合自身知識庫或語料庫,快速開發出適用於各行業的垂直解決方案。
尤為值得一提的是,阿裡雲於2025年3月6日發佈的QwQ-32B,不僅適用於企業,還便於個人開發者與普通用戶使用,且能在消費級顯卡上本地部署,大幅削减部署使用成本。 通過大規模强化學習,該模型在數學、程式碼及通用能力上實現飛躍,整體效能與DeepSeek-R1媲美。
然而,隨著Scaling Law(規模定律)帶來的邊際效益逐漸降低,以OpenAI為代表的大模型廠商在數據積累與算力堆砌上已接近現有科技和資源條件下的極限。 囙此,探尋新的優化路徑成為關鍵。 業界開始通過極致化算力優化降低成本,並在强化學習和推理階段改進,以更高效的管道訓練高性能模型。 QwQ-32B的推出,再次印證了强化學習在提升模型效能方面的巨大潜力。
阿裡雲表示,隨著開源模型的不斷湧現,其效能已能與最領先的閉源模型相媲美。 開源模式還降低了模型訓練成本,使最先進的模型能够低成本部署和應用。
有趣的是,為應對來自中國企業的競爭,穀歌和OpenAI等國際巨頭也開始調整策略,嘗試有限度的開源。 例如,穀歌此前專注於閉源模型Gemini,近期卻開源了Gemma 3; 曾被戲稱為CloseAI的OpenAI,在中國開源環境的影響下,其CEO Sam Altman承認閉源策略有誤,並公佈了未來開源計畫。
“雲+ AI”為應用大爆發做好準備
現時,越來越多企業傾向於直接使用大模型廠商提供的標準API服務,尤其適用於業務相對固定、無需大量定制化的場景。 使用API服務成本更為經濟,因其僅在實際調用時產生費用,特別適合有明顯波峰波谷需求的場景,如客服系統,除白天高峰時段外,其他時間需求較低,無需從頭開發大模型,從而顯著降低成本。
阿裡雲百煉平臺是阿裡專為企業打造的AI大模型服務平臺,助力企業和開發者更高效地構建、訓練與部署AI應用。 現時,基於該平臺的API調用是阿裡雲大模型商業化的主要途徑。 阿裡雲百煉平臺提供快速便捷的服務接入方式,方便用戶輕鬆利用阿裡雲的大模型能力。
除標準API調用外,阿裡雲還提供聯合開發的整套AI定制化解決方案服務,涵蓋模型微調、定制模型等,滿足對模型科技不熟悉或有高度定制化需求的客戶。 針對有數據安全性和隱私保護需求的用戶,阿裡雲推出私有化部署方案,如將模型集成到一體機中直接銷售給客戶。
在推動開源大模型商業化行程中,阿裡雲不斷探索更具性價比的AI能力開放管道。
自2024年起,阿裡雲多次下調通義千問系列模型價格,其中Qwen-Long API輸入價格從0.02元/千tokens降至0.0005元/千tokens,降幅達97%。 其他模型如Qwen-Turbo、Qwen-Plus、Qwen-Max以及視覺理解模型等也大幅降價,讓更多企業和開發者能以更低的成本獲取AI能力。
值得注意的是,成本的不斷降低得益於阿裡雲在AI基礎設施方面的持續進步,特別是在提升計算效率、優化網絡效能以及加快存儲速度等方面。 例如,阿裡雲推出支持超10萬個GPU穩定連接的高性能網絡架構HPN7.0、最大支持單機16卡的磐久AI服務器以及數據輸送量達20TB/s的CPFS檔存儲。
此外,阿裡雲百煉平臺已集成200多款大模型API,涵蓋國內外主流開源和閉源模型。 為降低用戶使用文字大模型API的成本,阿裡雲百煉平臺推出全新KV Cache計費模式,通過自動緩存上下文避免重複計算,進一步降低模型調用成本,適用於長文字、程式碼補全、多輪對話、特定文字摘要等場景。
總體來看,AI開源大模型在商業化過程中面臨兩大痛點:一是缺乏能顯著提升用戶體驗或效率的“殺手級應用”,意味著市場尚未完全準備好迎接AI大模型,其應用場景和潜力有待進一步發掘和驗證; 二是B端市場仍處於初步探索階段,企業管理層對利用開源大模型實現業務價值的認識不足,相比閉源大模型,更難說服其投資AI解決方案。
針對這些挑戰和未來規劃,阿裡通過“雲+ AI”的一體化全棧方案做了準備。 例如,利用AI基礎設施的產品力拓展B端市場。 同時,通過誇克的改版陞級等實踐,在C端市場探索大模型應用潜力,旨在打造現象級產品樣本,展示最佳的AI體驗入口。
通義千問的多場景探索
隨著大模型科技的不斷進步,其在多個場景展現出巨大的應用價值和潜力。
2024年1月,中國一汽聯合通義千問推出汽車行業首個基於大模型的商業智慧(BI)應用——GPT-BI。 一汽借助千問大模型能力實現數據智能化,將大量沉睡的數據資產轉化為有價值的資源。
具體來說,GPT-BI助力一汽實現銷售數據自動報表生成,極大提升工作效率。 一汽紅旗品牌運營委員會副總裁門欣表示,AI在實際工作中還有更多應用場景。 例如,在整車開發過程中,涉及大量數據,包括汽車生產的尺寸匹配、工藝評審、裝配策略等,這些環節原先依賴人工衡量。 如今,紅旗基於這些數據和要求生成紅旗汽車自動評估模型,並引入整車生產過程,使原本耗時20天、50天甚至80天以上的環節,在工作臺上縮短至秒級或天級完成。
基於GPT-BI等真實業務場景的探索,一汽還計畫利用大量高品質數據資產,在“阿裡雲百煉”一站式大模型應用開發平臺上打造面向研發、製造、售後服務等多領域的垂直大模型,讓大模型在生產、銷售等環節充分發揮效用。
2025年3月11日,Manus平臺宣佈與阿裡通義千問團隊達成戰略合作。 雙方將基於通義千問系列開源模型,在國產模型和算力平臺上實現Manus的全部功能,致力於為中國用戶打造更具創造力的通用智慧體產品。
業界普遍認為,Manus與阿裡的合作不僅是利用先進大模型,也是為了尋找高性價比的雲平臺以滿足龐大算力需求,特別是在中國市場。 雙方合作將加速AI智慧體產業化進程,通過高效、經濟的云計算解決方案降低運營成本,提升服務效能。
不久前,全球知名科技巨頭蘋果公司與阿裡達成合作,阿裡作為蘋果供應商為中國版iPhone開發人工智慧功能。
分析人士指出,蘋果選擇與阿裡合作,一方面看中阿裡雲平臺的算力優勢,另一方面是由於通義千問模型系列具備强大多模態能力。 對於AI智慧體而言,除了强大的語言模型,還需具備處理視覺、音訊等多模態輸入的理解能力,這是蘋果等公司在選擇AI大模型合作夥伴時的關鍵考量點之一。
在多模態能力方面,通義千問Qwen-Vision Language模型表現出色。 以最新版Qwen2.5-VL為例,該模型不僅能處理文字輸入輸出,還具備處理視覺和視頻輸入的能力,包括對長達1小時的視頻進行理解。
相較於上一代Qwen2-VL,該模型進行了多項更新。 例如,增强的Grounding能力提升了對物理事件和物體的識別能力,使模型能更好地關聯文字描述與實際影像或視頻中的元素。 增强的OCR(光學字元識別)能力在處理複雜或手寫文字、長文字時表現出色,無需針對特定類型文字進行額外調优,並且在處理散發性角度的文字時表現更佳。
在Qwen2.5-VL中,通義千問團隊還設計了更全面的檔案解析格式——QwenVL HTML格式,既能精准識別檔案中的文字,又能選取檔案元素(如圖片、表格等)的位置資訊,準確還原檔案版面佈局。
據介紹,該模型除了效能强大外,還內寘agent能力,例如能輸出符合標準JS格式的檔案,這對於智慧體的實際應用至關重要。 只有輸出格式標準化,智慧體才能有效調用這些結果。 通過這些巧妙設計,不僅增强了模型的功能性和實用性,也為未來AI產業發展提供了有力支持。
自2024年起,阿裡雲開始將大模型直接部署到手機等設備端,以實現本地任務執行,如語音摘要生成等。 阿裡與蘋果的合作採用端雲結合架構,雲端擁有大型模型,設備端配寘較小參數模型,並結合安全措施,這是未來重點發展方向。
從部署模式來看,大模型在手機的部署管道主要有兩種:一是本地部署,將大模型內寘到手機中,或部署較小模型(如0.5B至7B參數規模),用於執行對數據敏感的任務; 二是雲端結合,本地運行較小模型處理敏感數據,複雜任務則通過網絡提交給雲端大模型處理。
雲端大模型優勢在於效能强大,能處理複雜任務,參數多,效能表現好,但存在延遲和資料傳輸隱私問題。 本地大模型則提供更好的數據安全性和隱私保護,所有處理在設備上完成,對於基礎任務已足够使用,但受尺寸限制,效能不如雲端模型,體驗可能稍遜。
儘管本地模型能滿足基礎任務需求,但對於更高智慧水准的定制化需求,雲端大模型仍是不可或缺的。 未來發展趨勢可能是尋求平衡,利用本地模型保障資料安全和快速回應,同時依靠雲端模型解决複雜問題。