2℃AutoAgents:自然語言創(chuàng)建和部署LLM智能體的終極解決方案
AutoAgents 是基于 LLM 的自動智能體生成框架,能按目標生成智能體協作完成任務,具多種功能,應用于多領域,有簡單使用方法,優(yōu)勢顯著。
1℃CLaMP 3:清華大學推出的多模態(tài)音樂信息檢索框架
CLaMP 3 由清華大學朱文武教授團隊開發(fā),是多模態(tài)多語言音樂信息檢索框架,基于對比學習,具多種功能,靠獨特技術支撐,應用于多領域,有豐富項目資源。
3℃DynamicCity:引領未來的4D動態(tài)場景生成框架
DynamicCity 是上海 AI Lab 開發(fā)的 4D 生成框架,專注生成具語義信息的動態(tài) LiDAR 場景,具多種功能,基于 VAE 和 DiT 模型的獨特技術原理,應用于多領域,可從多渠道了解。
1℃LLaDA:中國人民大學與螞蟻集團聯合推出的革命性擴散大語言模型
LLaDA 是中國人民大學高瓴 AI 學院與螞蟻集團聯合推出的擴散大語言模型,基于擴散模型框架,具多種核心優(yōu)勢與功能,靠獨特技術支撐,應用于多領域,有豐富項目資源。
1℃Magma:微軟研究院推出的多模態(tài)AI基礎模型,重新定義AI能力邊界
Magma 是微軟研究院聯合高校開發(fā)的多模態(tài) AI 基礎模型,能為智能代理提供通用能力,具多核心優(yōu)勢與技術創(chuàng)新,應用于多領域,有豐富項目資源,前景廣闊。
1℃MoBA:Moonshot AI 提出的新型注意力機制,高效處理長文本的革命性技術
MoBA 是 Moonshot AI 推出的新型注意力機制,為提升大語言模型長上下文處理效率而設計,具多核心優(yōu)勢與功能,基于獨特技術原理,應用于多領域,可從相關平臺了解。
1℃Muse – 微軟研究院推出的生成式AI模型:深度解析與應用前景
Muse 是微軟研究院推出的游戲創(chuàng)意生成生成式 AI 模型,能模擬真實玩法,具多種功能,基于前沿技術,應用于多游戲場景,有豐富項目資源,前景廣闊。
3℃Phantom:字節(jié)跳動 AI 框架,實現主體一致視頻生成的創(chuàng)新解決方案
Phantom 是字節(jié)跳動智能創(chuàng)作團隊開發(fā)的視頻生成框架,基于跨模態(tài)對齊技術,具多種功能,靠獨特技術支撐,應用于多領域,有豐富資源支持且優(yōu)勢顯著。
3℃Qihoo-T2X:引領未來的高效多模態(tài)生成模型
Qihoo-T2X 是 360 AI 研究院與中山大學聯合開發(fā)的多模態(tài)生成模型,基于 PT-DiT,具多種功能,靠獨特技術支撐,應用于多領域,有相關項目資源,前景廣闊。
3℃RSIDiff – 基于合成數據提升圖像生成質量的遞歸自訓練框架
RSIDiff 是基于合成數據的遞歸自訓練框架,用于提升文本到圖像擴散模型性能。通過獨特的三種策略,解決生成質量、偏好對齊和模型穩(wěn)定性問題,減少對大規(guī)模數據集依賴,在多領域應用前景廣泛,可從 arXiv 論文了解其技術細節(jié)。
3℃Step-Audio-TTS-3B – 高性能 TTS 模型,助力多場景語音合成
Step-Audio-TTS-3B 是 Stepfun-AI 團隊開發(fā)的高性能 TTS 模型,有 30 億參數,具多語言、情感風格控制等功能,基于獨特技術原理,應用于多領域,可在 HuggingFace 體驗。
4℃SWE-Lancer:OpenAI 推出的革命性大模型基準測試工具
SWE-Lancer 是 OpenAI 推出的大模型基準測試工具,用真實軟件工程任務評估語言模型,含多種功能,基于獨特技術原理,應用于多領域,可從官網和倉庫了解。
3℃ToddlerBot – 斯坦福大學開源的機器學習與人形機器人平臺
ToddlerBot 是斯坦福大學開源的機器學習與人形機器人平臺,為高效收集數據設計,具多種功能,基于數字孿生等技術,應用于多領域,有豐富項目資源。
7℃TongGeometry——引領幾何 AI 的未來
TongGeometry 是北京通用人工智能研究院與北京大學聯合開發(fā)的幾何模型,能解決生成奧林匹克幾何問題,具多種功能,基于創(chuàng)新技術,應用于多領域,有廣闊未來展望。
5℃流暢閱讀:一款強大的開源AI瀏覽器翻譯插件
流暢閱讀是基于 AI 的開源瀏覽器翻譯插件,支持多翻譯引擎,具智能翻譯等多種功能,基于獨特技術原理,應用于多場景,有項目官網和倉庫。
6℃瑞智病理大模型 – 瑞金聯合華為推出的多模態(tài)互動式病理大模型
瑞智病理大模型是瑞金醫(yī)院與華為共同開發(fā)的多模態(tài)病理模型,通過多模態(tài)數據融合提升診斷,基于深度學習等技術,應用于多醫(yī)療場景,優(yōu)勢顯著,前景廣闊。
9℃Ovis2:阿里巴巴推出多模態(tài)大語言模型,解鎖AI新可能
Ovis2 是阿里巴巴國際團隊推出的多模態(tài)大語言模型,基于結構化嵌入對齊技術,有多種參數規(guī)模版本,具多模態(tài)理解等多種功能,靠獨特技術支撐,應用于多領域,可從多平臺獲取。
5℃OSUM:西北工業(yè)大學開源的多任務語音理解模型,助力語音識別與情感分析
OSUM 是西北工業(yè)大學計算機學院相關研究組開發(fā)的開源語音理解模型,結合 Whisper 編碼器與 Qwen2 LLM,基于 “ASR+X” 策略訓練,支持語音識別、情感識別等多種任務,技術原理獨特,應用場景廣泛,可從多渠道獲取使用。
6℃Crawl4LLM – 清華和卡內基梅隆大學聯合開源的智能爬蟲系統(tǒng)
Crawl4LLM 由清華和卡內基梅隆大學聯合開發(fā)并開源,旨在提升 LLM 預訓練效率,具多核心優(yōu)勢與功能,靠獨特技術支撐,應用于多領域,可從多渠道獲取信息。
5℃AI co-scientist – 谷歌推出多智能體協作的 AI 科研助手
AI co-scientist 是谷歌基于 Gemini 2.0 開發(fā)的多智能體協作系統(tǒng),能模擬科研全流程,具多種功能,靠獨特技術支撐,應用于多科研領域,可從多渠道了解體驗。
6℃AgentSociety – 清華大學推出的社會模擬器
AgentSociety 是清華大學開發(fā)的社會模擬器,結合大語言模型和多智能體系統(tǒng),具多項核心功能,靠獨特技術支撐,應用于多領域,提供豐富項目資源。
5℃Sitcom-Crafter – 北航聯合港中文等高校推出的 3D 人類動作生成系統(tǒng)
Sitcom-Crafter 由多校聯合開發(fā),能依長劇情指導自動生成 3D 人類動作,具多項創(chuàng)新與功能,靠獨特技術支撐,應用于多領域,可從多渠道獲取資源。
5℃SigLIP 2:Google DeepMind 推出的多語言視覺語言編碼器模型解析
SigLIP 2 是 Google DeepMind 開發(fā)的多語言視覺 - 語言模型,具多核心優(yōu)勢與功能,靠獨特技術支撐,應用于多領域,可從多平臺獲取相關資源。
6℃PaliGemma 2 mix – 谷歌DeepMind推出的升級版視覺語言模型
PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任務視覺語言模型,基于開源框架開發(fā),具多種功能,靠獨特技術支撐,應用于多領域,可從多平臺獲取信息。
4℃Moonlight-16B-A3B – 月之暗面開源的 MoE 模型
Moonlight-16B-A3B 由 Moonshot AI 開發(fā),是 MoE 開源模型,具高效優(yōu)化器等技術優(yōu)勢,在多任務表現卓越,應用于多領域,開源資源豐富。