FlagEval(天秤)由智源研究院將聯合多個高校團隊打造,是一種采用“能力—任務—指標”三維評測框架的大模型評測平臺,旨在提供全面、細致的評測結果。該平臺已提供了 30 多種能力、5 種任務和 4 大類指標,共 600 多個維度的全面評測,任務維度包括 22 個主客觀評測數據集和 84433 道題目,大家快來奇想AI導航網!
??版權聲明:若無特殊聲明,本站所有文章版權均歸奇想AI導航網原創和所有,未經許可,任何個人、媒體、網站、團體不得轉載、抄襲或以其他方式復制發表本站內容,或在非我站所屬的服務器上建立鏡像。否則,我站將依法保留追究相關法律責任的權利。