久久九九热免费视频,天堂√中文最新版在线,亚洲欧美校园春色,国产中文在线播放

Gemma
開源模型
奇想AI Al訓練模型

Gemma

谷歌推出的新一代輕量級開放模型

標簽:

Gemma是什么

Gemma是由谷歌DeepMind和谷歌的其他團隊開發(fā)的一系列輕量級、先進的開放AI模型,基于與Gemini模型相同的技術,旨在幫助開發(fā)者和研究人員構建負責任的AI應用。Gemma模型系列包括兩種權重規(guī)模的模型:Gemma 2B 和 Gemma 7B,提供預訓練和指令微調版本,支持多種框架,如JAX、PyTorch和TensorFlow,以在不同設備上高效運行。6月28日,第二代模型Gemma 2已發(fā)布,大家快來奇想AI導航網!

Gemma
Gemma的官方入口

  • Gemma的官網主頁:https://ai.google.dev/gemma?hl=zh-cn
  • Gemma的Hugging Face模型:https://huggingface.co/models?search=google/gemma
  • Gemma的Kaggle模型地址:https://www.kaggle.com/models/google/gemma/code/
  • Gemma的技術報告:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf
  • 官方PyTorch實現GitHub代碼庫:https://github.com/google/gemma_pytorch
  • Gemma的Google Colab運行地址:https://colab.research.google.com/github/google/generative-ai-docs/blob/main/site/en/gemma/docs/lora_tuning.ipynb

Gemma的主要特性

  • 輕量級架構:Gemma模型設計為輕量級,便于在多種計算環(huán)境中運行,包括個人電腦和工作站。
  • 開放模型:Gemma模型的權重是開放的,允許用戶在遵守許可協(xié)議的情況下進行商業(yè)使用和分發(fā)。
  • 預訓練與指令微調:提供預訓練模型和經過指令微調的版本,后者通過人類反饋強化學習(RLHF)來確保模型行為的負責任性。
  • 多框架支持:Gemma支持JAX、PyTorch和TensorFlow等主要AI框架,通過Keras 3.0提供工具鏈,簡化了推理和監(jiān)督微調(SFT)過程。
  • 安全性與可靠性:在設計時,Gemma遵循Google的AI原則,使用自動化技術過濾訓練數據中的敏感信息,并進行了一系列安全評估,包括紅隊測試和對抗性測試。
  • 性能優(yōu)化:Gemma模型針對NVIDIA GPU和Google Cloud TPUs等硬件平臺進行了優(yōu)化,確保在不同設備上都能實現高性能。
  • 社區(qū)支持:Google提供了Kaggle、Colab等平臺的免費資源,以及Google Cloud的積分,鼓勵開發(fā)者和研究人員利用Gemma進行創(chuàng)新和研究。
  • 跨平臺兼容性:Gemma模型可以在多種設備上運行,包括筆記本電腦、臺式機、物聯(lián)網設備和云端,支持廣泛的AI功能。
  • 負責任的AI工具包:Google還發(fā)布了Responsible Generative AI Toolkit,幫助開發(fā)者構建安全和負責任的AI應用,包括安全分類器、調試工具和應用指南。

Gemma
Gemma的技術要點

  • 模型架構:Gemma基于Transformer解碼器構建,這是當前自然語言處理(NLP)領域最先進的模型架構之一。采用了多頭注意力機制,允許模型在處理文本時同時關注多個部分。此外,Gemma還使用了旋轉位置嵌入(RoPE)來代替絕對位置嵌入,以減少模型大小并提高效率。GeGLU激活函數取代了標準的ReLU非線性激活,以及在每個Transformer子層的輸入和輸出都進行了歸一化處理。
  • 訓練基礎設施:Gemma模型在Google的TPUv5e上進行訓練,這是一種專為機器學習設計的高性能計算平臺。通過在多個Pod(芯片集群)上進行模型分片和數據復制,Gemma能夠高效地利用分布式計算資源。
  • 預訓練數據:Gemma模型在大量英語數據上進行預訓練(2B模型大約2萬億個token的數據上預訓練,而7B模型則基于6萬億個token),這些數據主要來自網絡文檔、數學和代碼。預訓練數據經過過濾,以減少不想要或不安全的內容,同時確保數據的多樣性和質量。
  • 微調策略:Gemma模型通過監(jiān)督式微調(SFT)和基于人類反饋的強化學習(RLHF)進行微調。這包括使用合成的文本對和人類生成的提示響應對,以及基于人類偏好數據訓練的獎勵模型。
  • 安全性和責任:Gemma在設計時考慮了模型的安全性和責任,包括在預訓練階段對數據進行過濾,以減少敏感信息和有害內容的風險。此外,Gemma還通過了一系列的安全性評估,包括自動化基準測試和人類評估,以確保模型在實際應用中的安全性。
  • 性能評估:Gemma在多個領域進行了廣泛的性能評估,包括問答、常識推理、數學和科學問題解答以及編碼任務。Gemma模型與同樣規(guī)?;蚋笠?guī)模的開放模型進行了性能對比,在MMLU、MBPP等18個基準測試中,有11個測試結果超越了Llama-13B或Mistral-7B等模型。
  • 開放性和可訪問性:Gemma模型以開源的形式發(fā)布,提供了預訓練和微調后的檢查點,以及推理和部署的開源代碼庫。這使得研究人員和開發(fā)者能夠訪問和利用這些先進的語言模型,推動AI領域的創(chuàng)新。

 

??版權聲明:若無特殊聲明,本站所有文章版權均歸奇想AI導航網原創(chuàng)和所有,未經許可,任何個人、媒體、網站、團體不得轉載、抄襲或以其他方式復制發(fā)表本站內容,或在非我站所屬的服務器上建立鏡像。否則,我站將依法保留追究相關法律責任的權利。

類似于Gemma的工具

主站蜘蛛池模板: 龙胜| 五家渠市| 都安| 芷江| 敦化市| 江津市| 麻江县| 茂名市| 盱眙县| 南木林县| 太康县| 开鲁县| 虞城县| 唐山市| 茌平县| 岳普湖县| 静安区| 上思县| 曲水县| 邢台市| 孝义市| 阳泉市| 蒙城县| 九台市| 东海县| 东阳市| 霍山县| 昌黎县| 舟曲县| 华阴市| 扶风县| 滨州市| 准格尔旗| 晋州市| 桑日县| 吉安市| 芮城县| 尉氏县| 石屏县| 荆门市| 汉阴县|