StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一個通過基于人類反饋的強化學習(RLHF)訓練的大規模開源聊天機器人。StableVicuna是Vicuna v0 13b的進一步指令微調和RLHF訓練版本,它是一個指令微調的 LLaMA 130億模型,大家快來奇想AI導航網!
??版權聲明:若無特殊聲明,本站所有文章版權均歸奇想AI導航網原創和所有,未經許可,任何個人、媒體、網站、團體不得轉載、抄襲或以其他方式復制發表本站內容,或在非我站所屬的服務器上建立鏡像。否則,我站將依法保留追究相關法律責任的權利。