Devin是什么
Devin是由人工智能初創(chuàng)公司Cognition推出的全球首個(gè)全自主的AI軟件工程師智能體,具備強(qiáng)大的編程和軟件開(kāi)發(fā)能力,能夠在多個(gè)方面協(xié)助或完全獨(dú)立地完成軟件開(kāi)發(fā)任務(wù)。在SWE-bench基準(zhǔn)測(cè)試中,Devin解決實(shí)際問(wèn)題的表現(xiàn)遠(yuǎn)超如GPT-4和Claude 2等AI模型,大家快來(lái)奇想AI導(dǎo)航網(wǎng)!
Devin的開(kāi)發(fā)公司Cognition正式成立雖然僅兩個(gè)月,但團(tuán)隊(duì)成員擁有豐富的AI前沿工作經(jīng)驗(yàn),并且擁有多枚國(guó)際信息學(xué)奧林匹克競(jìng)賽(IOI)金牌,已獲彼得·蒂爾的Founders Fund基金領(lǐng)投的2100萬(wàn)美元A輪融資。
Devin的主要功能
- 自主學(xué)習(xí)新技術(shù):Devin能夠通過(guò)閱讀文檔和代碼來(lái)學(xué)習(xí)它不熟悉的技術(shù),從而擴(kuò)展其技能集。
- 端到端構(gòu)建和部署程序:Devin 能夠理解整個(gè)軟件開(kāi)發(fā)流程,從前端設(shè)計(jì)到后端部署,甚至包括將應(yīng)用程序發(fā)布上線。這意味著它可以從零開(kāi)始構(gòu)建網(wǎng)站、游戲或其他軟件項(xiàng)目,并處理相關(guān)的工作流程。
- 自主查找并修復(fù)Bug:Devin 具有出色的調(diào)試能力,能夠發(fā)現(xiàn)并修復(fù)代碼中的錯(cuò)誤,即使開(kāi)發(fā)者自己都沒(méi)有注意到的問(wèn)題也能被它找到并解決。
- 訓(xùn)練和微調(diào)AI模型:Devin 不僅能夠處理常規(guī)的編程任務(wù),還能幫助訓(xùn)練和微調(diào)其他AI模型,顯示出在人工智能領(lǐng)域的深度應(yīng)用能力。
- 修復(fù)開(kāi)源庫(kù):對(duì)于開(kāi)源社區(qū)中的問(wèn)題,Devin 能夠理解和解決,例如修復(fù)已知的bug或?qū)崿F(xiàn)新的特性請(qǐng)求。
- 對(duì)成熟生產(chǎn)庫(kù)做貢獻(xiàn):Devin 能夠?qū)σ呀?jīng)成熟的生產(chǎn)庫(kù)做出貢獻(xiàn),例如修復(fù)已知的錯(cuò)誤或添加新功能。

Devin的性能對(duì)比
在SWE-bench基準(zhǔn)測(cè)試中(要求智能體解決在 Django 和 scikit-learn 等開(kāi)源項(xiàng)目中發(fā)現(xiàn)的實(shí)際 GitHub 問(wèn)題),Devin能夠正確處理13.86%的問(wèn)題。這一成績(jī)顯著高于之前技術(shù)水平的1.96%,顯示出Devin在理解和解決實(shí)際編程問(wèn)題方面的巨大優(yōu)勢(shì)。
對(duì)比其他AI模型:Devin的表現(xiàn)遠(yuǎn)遠(yuǎn)超過(guò)了其他知名的AI模型,如GPT-4和Claude 2,這些模型在同樣的測(cè)試中的正確率通常較低。

如何使用Devin
目前Devin還在內(nèi)測(cè)中,請(qǐng)?jiān)L問(wèn)Coginition的官網(wǎng)查看更多信息,想要搶先體驗(yàn)的用戶(hù)可填寫(xiě)Devin的內(nèi)測(cè)申請(qǐng)表。