StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一個通過基于人類反饋的強化學(xué)習(xí)(RLHF)訓(xùn)練的大規(guī)模開源聊天機器人。StableVicuna是Vicuna v0 13b的進一步指令微調(diào)和RLHF訓(xùn)練版本,它是一個指令微調(diào)的 LLaMA 130億模型,大家快來奇想AI導(dǎo)航網(wǎng)!
??版權(quán)聲明:若無特殊聲明,本站所有文章版權(quán)均歸奇想AI導(dǎo)航網(wǎng)原創(chuàng)和所有,未經(jīng)許可,任何個人、媒體、網(wǎng)站、團體不得轉(zhuǎn)載、抄襲或以其他方式復(fù)制發(fā)表本站內(nèi)容,或在非我站所屬的服務(wù)器上建立鏡像。否則,我站將依法保留追究相關(guān)法律責任的權(quán)利。