AI大模型評測社區(qū)
大規(guī)模多任務(wù)語言理解基準(zhǔn)
一個全面的中文基礎(chǔ)模型評估套件
Hugging Face推出的開源大模型排行榜單
上海人工智能實驗室推出的大模型開放評測體系
中文通用大模型綜合性測評基準(zhǔn)
智源研究院推出的FlagEval(天秤)大模型評測平臺
一個綜合性的大模型中文評估基準(zhǔn)
全方位的多模態(tài)大模型能力評測體系
斯坦福大學(xué)推出的大模型評測體系
由復(fù)旦大學(xué)NLP實驗室推出的大模型評測基準(zhǔn)
以眾包方式進行匿名隨機對戰(zhàn)的LLM基準(zhǔn)平臺
生物醫(yī)學(xué)研究問答數(shù)據(jù)集和模型得分排行榜
奇想AI導(dǎo)航網(wǎng) 廣告投放 關(guān)于我們 免責(zé)聲明