新科技速遞|   國產開源模型封王   數學編碼能力躍進

新科技速遞| 國產開源模型封王 數學編碼能力躍進

Table Of Contents

[新科技速遞]

Qwen2.5
Qwen2.5的72B版本在語言理解與推理、數學及編程等多個領域與其他尖端模型有著同等出色的表現

阿里雲的雲棲大會上,宣佈再開源100多個Qwen 2.5大語言模型,針對不同景場的AI工具。Qwen 2.5表現驚艷,迅速成為開源大模型的王者,雖然比閉源GPT o1和Claude 3.5 Sonnet仍有距離,影響力尤有過之,Qwen 2.5甚至有機會挑戰Llama在開源的影響力。

Qwen 2.5參數從5億到720億(72B)不等,72B版本不少指標;包括MMLU、MATH和MBPP,超越4050億參數Llama3.1 405B,甚至是GPT-4。從X.com和Medium用戶分享的經驗,Qwen 2.5實戰表現,特別知識、數學和編碼能力,解題能力超卓,支持超過29種語言,而且可部署個人設備或雲端,支持汽車業、遊戲、科學等研究。

專業推理能力躍進

Qwen 系列是阿里雲自研的大模型, 2023 年 4 月開始發佈。Qwen 模型在 Hugging Face 及ModelScope 下載量超過4000萬次,,Hugging Face 上超過5萬個模型基於Qwen創建。

Qwen 2.5 新增 100多 個開源大模型,包括基礎模型、指令跟隨模型和擁有多種精度等級及方法量化模型,涵蓋語言、音頻和視覺等模態,以至針對編碼Qwen 2.5-Coder和數學專用模型Qwen 2.5-Math,通過思維鏈(CoT)和工具整合推理(TIR)解決中英文數學問題。

阿里通義開源負責人林俊暘說,受到GPT o1成功的啟發,大模型應該深入研究推理能力。相信以強化學習思維鏈,大模型推理後再作答,可能會是發展方向。

Qwen 2.5的14B 和32B大模型可部署在具AI加速或GPU的個人電腦上,從各項指標比較,32B性能較72B低不足5%,Qwen 2.5發佈3日,Ollama上的下載量近3萬。

拓展多模態應用

阿里雲智能首席技術官周靖人說:「阿里雲將繼續致力於投資先進的AI基礎設施,以促進生成式AI在不同行業應用。」

阿里雲也推出圖像生成器「通義萬相」,可以—文生視頻模型,支援中英文生成從寫實到3D動畫多種視覺風格視頻,可將靜態圖像轉化為視頻,採用擴散變換器(DiT)提升視頻重建質量。

視覺語言模型方面則推出Qwen2-VL,理解長達20分鐘以上視頻,可基於視頻內容的問答。Qwen2-VL有推理和決策能力,可應用在手機、汽車和機械人中,特定操作場景下實現自動化。

Qwen 2.5充份顯示了阿里雲在AI實力,宣佈全棧AI基礎設施創新升級,包括新一代數據中心架構CUBE DC 5.0,透過自研技術,如風液同源冷卻架構、全直流電力架構和智能管理系統,提高能源運營效率,數據中心部署時間比傳統縮短五成。

醫療創新| BioTech|ESG|     醫療保健及可持續發展大熱   本港兩初創在JUMPSTARTER 2022獲勝

醫療創新| BioTech|ESG| 醫療保健及可持續發展大熱 本港兩初創在JUMPSTARTER 2022獲勝

滙豐香港工商金融中小企業主管王海珍(左2)、阿里巴巴香港創業者基金執行董事周駱美琪(左3)與優勝隊伍代表Gense Technologies聯合創辦人陳柏衡(左1)及Open Ocean …

了解更多
量化媒體情緒影響   語言分析預測市場

量化媒體情緒影響 語言分析預測市場

慧科訊業副總裁何超:應用慧科深度學習情緒分析模型,量化媒體報道正面和負面語氣和情緒。 新科技速遞 人工智能的語義分析技術,可用於評估市場情緒,甚至與市場波動有關。部分人工智能甚至想到利用自然語言處 …

了解更多
Microsoft發佈雲原生SIEM 偵察回應一氣呵成

Microsoft發佈雲原生SIEM 偵察回應一氣呵成

Microsoft 香港區域科技長許遵發(左)及大中華網絡安全行政官潘漢昇:利用Sentinel自動接收Microsoft 365的紀錄檔,馬上分析保安威脅,Sentinel容易建立,有望普 …

了解更多