FlagEval(天秤)由智源研究院將聯(lián)合多個(gè)高校團(tuán)隊(duì)打造,是一種采用“能力—任務(wù)—指標(biāo)”三維評(píng)測(cè)框架的大模型評(píng)測(cè)平臺(tái),旨在提供全面、細(xì)致的評(píng)測(cè)結(jié)果。該平臺(tái)已提供了 30 多種能力、5 種任務(wù)和 4 大類(lèi)指標(biāo),共 600 多個(gè)維度的全面評(píng)測(cè),任務(wù)維度包括 22 個(gè)主客觀評(píng)測(cè)數(shù)據(jù)集和 84433 道題目,大家快來(lái)奇想AI導(dǎo)航網(wǎng)!
??版權(quán)聲明:若無(wú)特殊聲明,本站所有文章版權(quán)均歸奇想AI導(dǎo)航網(wǎng)原創(chuàng)和所有,未經(jīng)許可,任何個(gè)人、媒體、網(wǎng)站、團(tuán)體不得轉(zhuǎn)載、抄襲或以其他方式復(fù)制發(fā)表本站內(nèi)容,或在非我站所屬的服務(wù)器上建立鏡像。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。