CMMLU是一個綜合性的中文評估基準,專門用于評估語言模型在中文語境下的知識和推理能力,涵蓋了從基礎(chǔ)學(xué)科到高級專業(yè)水平的67個主題。它包括:需要計算和推理的自然科學(xué),需要知識的人文科學(xué)和社會科學(xué),以及需要生活常識的中國駕駛規(guī)則等。此外,CMMLU中的許多任務(wù)具有中國特定的答案,可能在其他地區(qū)或語言中并不普遍適用。因此是一個完全中國化的中文測試基準,大家快來奇想AI導(dǎo)航網(wǎng)!
??版權(quán)聲明:若無特殊聲明,本站所有文章版權(quán)均歸奇想AI導(dǎo)航網(wǎng)原創(chuàng)和所有,未經(jīng)許可,任何個人、媒體、網(wǎng)站、團體不得轉(zhuǎn)載、抄襲或以其他方式復(fù)制發(fā)表本站內(nèi)容,或在非我站所屬的服務(wù)器上建立鏡像。否則,我站將依法保留追究相關(guān)法律責任的權(quán)利。