36℃什么是AIGC:AI Generated Content 人工智能生成內容 – AI百科知識
什么是AIGCAIGC是AI-generated Content的縮寫,中文名為人工智能生成內容,一種利用人工智能進行內容創作的方式,被認為是繼PGC(Professionally-generated Content)和UGC(User...
27℃什么是深度學習(Deep Learning) – AI百科知識
什么是深度學習深度學習(Deep Learning)是機器學習的一個子集,而機器學習是人工智能的一個分支,它使計算機能夠從數據中學習并執行通常需要人類智能才能完成的任務。深度學習使用人工神經網絡,一種受人腦結構和功能啟發的算法,可以從大...
28℃什么是NLP自然語言處理?定義、重要性、發展和應用 – AI百科
NLP自然語言處理的定義NLP(全稱Natural Language Processing),即自然語言處理,是計算機科學的一個領域,重點是創建能夠理解人類語音和語言的計算機和軟件。人類和計算機的語言是非常不同的,編程語言作為兩者之間...
39℃什么是 AGI?(Artificial General Intelligence)通用人工智能的定義和能力
什么是 AGI(人工通用智能)?AGI 是 Artificial General Intelligence 的縮寫,中文翻譯為“通用人工智能”,該術語指的是機器能夠完成人類能夠完成的任何智力任務的能力。與狹義的人工智能(ANI)不同,...
74℃LM Studio – 開源、傻瓜、一站式部署本地大模型 (LLM) 的應用平臺
LM Studio是什么LM Studio 是一個本地大語言模型 (LLM) 應用平臺,開源、傻瓜、一站式部署本地大模型。包括但不限于Llama、MPT、Gemma等,LM Studio 提供了一個圖形用戶界面(GUI),即使是非技術人員...
28℃edge-tts – 開源的AI文字轉語音項目
edge-tts是什么edge-tts是開源的AI文字轉語音項目,支持超過40種語言和300多種聲音。edge-tts利用微軟Azure Cognitive Services的強大功能,能將文本信息轉換成流暢自然的語音輸出。edge-tt...
33℃什么是無監督學習(Unsupervised Learning)?定義、技術、應用和挑戰 – AI百科知識
隨著人工智能(AI)領域的發展,機器學習已經成為一種核心技術,使計算機能夠自行學習并做出決定。廣義上講,機器學習可以分為三個主要類別:監督學習、無監督學習和強化學習。雖然監督學習因其廣泛的應用而備受關注,但無監督學習在釋放人工智能的真正力量...
28℃LLaVA-OneVision – 字節跳動推出的開源多模態AI模型
LLaVA-OneVision是什么LLaVA-OneVision是字節跳動推出開源的多模態AI模型,LLaVA-OneVision通過整合數據、模型和視覺表示的見解,能同時處理單圖像、多圖像和視頻場景下的計算機視覺任務。LLaVA-On...
21℃MUMU – 文本和圖像驅動的多模態生成模型
MUMU是什么MUMU是一種多模態圖像生成模型,通過結合文本提示和參考圖像來生成目標圖像,從而提高生成的準確率和質量。MUMU模型的架構基于SDXL的預訓練卷積UNet,采用了視覺語言模型Idefics2的隱藏狀態構建。模型在訓練時使用了...
22℃什么是多模態深度學習?定義、原因、應用和挑戰 – AI百科知識
什么是多模態深度學習?多模態深度學習(英文名:Multimodal Deep Learning)是人工智能(AI)的一個子領域,其重點是開發能夠同時處理和學習多種類型數據的模型。這些數據類型,或稱模態,可以包括文本、圖像、音頻、視頻和傳...
26℃Video-LLaVA2 – ChatLaw推出的開源多模態智能理解系統
Video-LLaVA2是什么Video-LLaVA2是由北京大學ChatLaw課題組推出的開源多模態智能理解系統,通過創新的時空卷積(STC)連接器和音頻分支,提升了視頻和音頻理解能力。模型在視頻問答和字幕生成等多個基準測試中表現出色,...
20℃什么是強化學習Reinforcement Learning?定義、概念、應用和挑戰 – AI百科知識
強化學習(RL)是機器學習的一個分支,重點是訓練算法通過與環境的互動來做出決定。它的靈感來自于人類和動物從他們的經驗中學習以實現目標的方式。在這篇文章中,我們將對強化學習、其關鍵概念和應用進行全面概述。一、什么是強化學習?強化學習(英文:...
27℃HMoE – 騰訊混元團隊提出的新型神經網絡架構
HMoE是什么HMoE(混合異構專家模型)是騰訊混元團隊提出的新型神經網絡架構,旨在提升大型語言模型的性能和計算效率。通過引入不同尺寸的專家來處理不同復雜性的輸入數據,從而增強模型的專業化程度。HMoE采用新的訓練目標和策略,如P-Pen...
43℃什么是預訓練Pre-training?定義、重要性、技術和挑戰 – AI百科知識
隨著人工智能(AI)不斷重塑我們的世界,其發展的一個關鍵方面已經成為現代機器學習模型的支柱:預訓練。在本篇文章中,我們將探討預訓練的概念,它在人工智能中的重要性,用于實現預訓練的各種技術,以及該領域的研究人員所面臨的一些挑戰。什么是預訓練?...
22℃什么是LLM大語言模型?定義、訓練方式、流行原因和例子 – AI百科知識
近年來人工智能(AI)領域經歷了巨大的增長,而自然語言處理(NLP)更是其中一個取得快速進展的領域。NLP中最重要的發展便是大語言模型(LLM),該項技術可能徹底改變我們與科技互動的方式,加上OpenAI的GPT-3的爆火,使得大語言模型在...
24℃什么是情感分析(Sentiment Analysis)? – AI百科知識
在今天這個數字連接的世界里,人們不斷地在各種平臺上分享他們的想法和意見,從社交媒體網站到在線評論論壇。這些用戶生成的文本提供了海量的信息,企業、政府和其他組織可以利用這些信息來獲得對其客戶的偏好、意見和情感的寶貴見解。作為自然語言處理(NL...
26℃LitServe – 基于FastAPI的高性能AI模型部署引擎
LitServe是什么LitServe是基于FastAPI的高性能AI模型部署引擎,專為企業級AI服務設計。支持批處理、流式處理和GPU自動擴展,簡化了模型部署流程。LitServe易于安裝和使用,通過pip即可安裝,提供靈活的API定義...
25℃什么是數據標注?機器學習中數據標注的重要性、類型和挑戰 – AI百科知識
什么是數據標注機器學習(ML)已經成為各種行業的重要組成部分,如醫療保健、金融和運輸,因為它能夠根據大量的數據進行分析和預測。其中,機器學習過程的一個重要方面便是數據標注(Data Annotation),數據標注是一個對原始數據進行標記...
16℃CustomCrafter – 騰訊聯合浙大推出的自定義視頻生成框架
CustomCrafter是什么CustomCrafter 是騰訊和浙江大學聯合提出的自定義視頻生成框架,能基于文本提示和參考圖像生成高質量的個性化視頻,同時保留了運動生成和概念組合的能力。CustomCrafter通過設計一系列靈活的模...
22℃LeRobot – HuggingFace推出的開源AI聊天機器人項目
LeRobot是什么LeRobot是由HuggingFace推出的開源AI聊天機器人項目,由前特斯拉研究員Remi Cadene領導開發。LeRobot致力于降低機器人技術的入門門檻,提供預訓練模型、數據集和模擬環境,支持模仿學習和強化學...
20℃什么是卷積神經網絡(CNN)?定義、工作原理和主要應用 – AI百科知識
什么是卷積神經網絡?卷積神經網絡(Convolutional Neural Network,CNN)是一類主要用于計算機視覺領域的深度學習算法,它們在各個領域都有應用,包括圖像和視頻識別、自然語言處理,甚至是玩游戲。CNN已經徹底改變了計...
22℃LongVILA – 面向長視頻理解的視覺語言AI模型
LongVILA是什么LongVILA是一個面向長視頻理解的視覺語言AI模型,由英偉達、MIT、UC 伯克利、得克薩斯大學奧斯汀分校共同開發。通過算法和系統的共同設計,實現了在大量GPU上進行超長上下文長度訓練的能力,無需梯度檢查點。Lo...
20℃EasyOCR – 支持超80種語言的開源OCR項目
EasyOCR是什么EasyOCR 是一個功能強大的開源OCR(光學字符識別)項目,支持80多種語言和多種書寫系統,包括中文、阿拉伯文和西里爾文。基于深度學習技術,提供高精度的文字識別能力。用戶可以通過簡單的API輕松地將圖像中的文本轉換...
34℃OmniCorpus – 百億級多模態數據集,支持中英雙語
OmniCorpus是什么OmniCorpus是一個大規模多模態數據集,包含86億張圖像和16960億個文本標記,支持中英雙語。由上海人工智能實驗室聯合多所知名高校及研究機構共同構建。OmniCorpus通過整合來自網站和視頻平臺的文本和...
21℃什么是LoRA?一文讀懂低秩適應的概念、原理、優缺點和主要應用
近年來自然語言處理(NLP)的進步很大程度上是由越來越強大的語言模型推動的,比如 OpenAI 的 GPT 系列大語言模型。然而,這些模型的訓練不僅在計算上很昂貴,而且還需要大量的數據、能量和時間。因此,研究人員一直在探索更有效的方法來微調...