久久九九热免费视频,天堂√中文最新版在线,亚洲欧美校园春色,国产中文在线播放

奇想AI AI模型評測

MMBench

全方位的多模態大模型能力評測體系

標簽:

MMBench是一個多模態基準測試,由上海人工智能實驗室、南洋理工大學、香港中文大學、新加坡國立大學和浙江大學的研究人員推出。該體系開發了一個綜合評估流程,從感知到認知能力逐級細分評估,覆蓋20項細粒度能力,從互聯網與權威基準數據集采集約3000道單項選擇題。打破常規一問一答基于規則匹配提取選項進行評測,循環打亂選項驗證輸出結果的一致性,基于ChatGPT精準匹配模型回復至選項,大家快來奇想AI導航網!

MMBench的特點和優勢

  1. 基于感知與推理,將評估維度逐級細分。約 3000 道單項選擇題,覆蓋目標檢測、文字識別、動作識別、圖像
    理解、關系推理等 20 個細粒度評估維度
  2. 更具魯棒性的評估方式。相同單選問題循環選項提問,模型輸出全部指向同一答案認定為通過,相比傳統1次性通過評估 top-1 準確率平均下降 10% ~ 20%。最大程度減少各種噪聲因素對評測結果的影響,保證了結果的可復現性。
  3. 更可靠的模型輸出提取方法?;?ChatGPT 匹配模型輸出與選項,即使模型未按照指令輸出也可準確匹配至最合理選項

 

??版權聲明:若無特殊聲明,本站所有文章版權均歸奇想AI導航網原創和所有,未經許可,任何個人、媒體、網站、團體不得轉載、抄襲或以其他方式復制發表本站內容,或在非我站所屬的服務器上建立鏡像。否則,我站將依法保留追究相關法律責任的權利。

類似于MMBench的工具

主站蜘蛛池模板: 白河县| 闽清县| 仁化县| 漾濞| 辽中县| 新营市| 长垣县| 和静县| 舒城县| 莱芜市| 怀宁县| 敦煌市| 察隅县| 渑池县| 广元市| 惠东县| 青阳县| 汽车| 金乡县| 永春县| 焦作市| 昆明市| 绥滨县| 堆龙德庆县| 玛沁县| 东乌珠穆沁旗| 拉孜县| 闽侯县| 视频| 平舆县| 德化县| 惠安县| 甘洛县| 吉隆县| 桐城市| 古浪县| 西华县| 原阳县| 同江市| 准格尔旗| 佛坪县|