應用方面
-
微信搜索接入 DeepSeek-R1:微信搜一搜的 “AI 搜索” 功能首批灰度測試開放 100 萬用戶,日均問答請求量突破 300 萬次,常規問題解答耗時 0.8 秒,復雜邏輯推理平均耗時 4.2 秒,較傳統搜索效率提升 12 倍。騰訊確認 AI 搜索僅調用公開數據,未使用聊天記錄等敏感信息。
-
宇樹科技機器人算法升級:宇樹科技官方發布視頻稱其機器人算法升級,可實現任意舞蹈的流暢表演,展現出在機器人算法研發上的強大實力,為機器人在更多領域的應用拓展了空間。
-
QQ 瀏覽器接入 DeepSeek-R1:QQ 瀏覽器宣布正式接入 DeepSeek - R1 模型滿血版,支持深度思考、聯網搜索、多輪對話、歷史記錄回溯。
-
廣州、深圳數據管理局系統接入 DeepSeek:廣州市數據管理局正式部署上線 DeepSeek - R1、V3 671B 大模型,通過融合海量數據要素豐富場景應用。深圳市也于 2 月 16 日面向全市各區各部門正式提供 DeepSeek 模型應用服務,實現人工智能應用一體化賦能升級。
-
階躍星辰和 MiniMax 接入 DeepSeek:階躍星辰的 “躍問” App 接入了 DeepSeek - R1 模型,MiniMax 01 海外版已上線 DeepSeek - R1 深度思考模式。
框架方面
-
Grok3 即將發布:馬斯克旗下 xAI 的 Grok3 大模型定于北京時間 2 月 18 日 12:00 正式亮相,將首次采用實時技術演示形式向全球公開展示。Grok3 預計整合萬億級參數集群,采用新型量子稀疏注意力機制,依托特斯拉 Dojo 2.0 超算平臺構建的混合訓練架構,使模型并行效率較傳統架構提升 320%。
-
Google Gemini2.0 進展:Google Gemini2.0 取得新突破,基礎版有 340B 參數,Pro 版突破 1.2T 參數,支持 200 萬 token 上下文窗口。在 GSM8K 數學題準確率達 99.1%,超越人類專家的 97.3%,IMO 競賽題解題效率提升 61%,采用動態稀疏激活技術,復雜計算任務能耗降低 39%。
-
Anthropic 動態算力分配模型:Anthropic 推出動態算力分配模型,可根據任務簡單或復雜,雙模切換調用 70B 輕量模型或 1400B 深度模型。應用在摩根士丹利衍生品定價模型運算上,耗時從 18 分鐘縮短至 7 分 23 秒,能耗成本降低 57%。