Chatbot Arena是一個大型語言模型 (LLM) 的基準(zhǔn)平臺,以眾包方式進行匿名隨機對戰(zhàn),該項目方LMSYS Org是由加州大學(xué)伯克利分校、加州大學(xué)圣地亞哥分校和卡內(nèi)基梅隆大學(xué)合作創(chuàng)立的研究組織。
通過demo體驗地址進入對戰(zhàn)平臺,輸入自己感興趣的問題,提交問題后,匿名模型會兩兩對戰(zhàn),分別生成相關(guān)答案,需要用戶對答案做出評判,從4個評判選項中選擇一個:模型A更好、模型B更好、平手、都很差。支持多輪對話。最終使用Elo評分系統(tǒng)對大模型的能力進行綜合評估。(可以自己指定模型看效果,但不計入最終排名情況),大家快來奇想AI導(dǎo)航網(wǎng)!
??版權(quán)聲明:若無特殊聲明,本站所有文章版權(quán)均歸奇想AI導(dǎo)航網(wǎng)原創(chuàng)和所有,未經(jīng)許可,任何個人、媒體、網(wǎng)站、團體不得轉(zhuǎn)載、抄襲或以其他方式復(fù)制發(fā)表本站內(nèi)容,或在非我站所屬的服務(wù)器上建立鏡像。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。