kaeken(嘉永島健司)Techブログ

主に情報科学/情報技術全般に関する知見をポストします。(最近は、特にData Science、機械学習、深層学習、統計学、Python、数学、ビッグデータ)

NVIDIA エッジ生成AIプラットフォーム Jetson Generative AI Lab まとめ

Home - NVIDIA Jetson Generative AI Lab

summary

  • Jetson Generative AI Labの開始: NVIDIAが開発者向けにこのプラットフォームを最近導入。
  • 目的: NVIDIA Jetsonエッジデバイスを使用して、現実世界の環境で生成AIの可能性を探索する。
  • Jetsonの能力:
    • Jetson AGX Orin上のLlama-2-70Bモデルのような大規模言語モデル(LLM)を実行可能。
    • ビジョントランスフォーマーや安定した拡散をローカルで対話的な速度で処理可能。
  • ラボのリソース: Jetsonで最新のモデルとアプリケーションをテストするためのチュートリアルとリソースを提供。
  • 開発者の焦点: 物理世界での生成AIの未開拓の可能性に集中。
  • 学習と発見のハブ: Jetsonデバイス上で最新の生成AIモデルとアプリケーションを実行する方法を学ぶ。
  • 分野の急速な進化:
    • ほぼ毎日新しいLLMが登場。
    • 量子化ライブラリの進歩により、一夜にしてベンチマークが再定義される。
  • ラボの提供内容:
  • GitHub Actionsの利用: CI/CD方式で100個のコンテナを構築。
  • 開発者の効率化: Jetsonで最新のAIモデル、ライブラリ、アプリケーションを迅速にテストできる。
  • 生成AIの探求: 開発者がJetsonを使用して現実世界の環境で生成AIの可能性を探求できるようにする。
  • 紹介されるアプリケーション:
    • A1111のsteady-diffusion-webui:Stability AIのStable Diffusionへのユーザーフレンドリーなインターフェイス
    • Oababoogaのtext-generation-webui:ローカルでLLMを実行するためのGradioベースのWebインターフェイス
    • Llamaspeak:ローカルで実行されているLLMとの口頭での会話を可能にするインタラクティブチャットアプリケーション。

video

Bringing Generative AI to Life with NVIDIA Jetson - YouTube

summary

NVIDIAの「Bringing Generative AI to Life with NVIDIA Jetson」というプレゼンテーションは、NVIDIAのDustyが、クラウドだけでなく、エッジでの生成AIモデルと大規模言語モデル(LLM)の展開についての進歩を説明しています。Dustyは、2020年のトランスフォーマーNVIDIAのAmpere A100 GPUの導入以来、AIモデルのサイズと知能が急速に成長していることを強調しています。特に、LamaやLama 2のような基礎モデルのオープンソーシングや、この分野に貢献している研究者、開発者、アーティスト、趣味家の活動的なコミュニティについて言及しています。

Dustyは、大型モデルを消費者向けハードウェアで実行する際の高い計算能力とメモリ要件による課題を説明します。それにもかかわらず、これらのモデルをローカルで、特に組み込みデバイスで展開する傾向があります。NVIDIAのJetsonプラットフォーム、特に大きなメモリと処理能力を持つJetson AGX-ORINは、遅延、帯域幅、プライバシー、セキュリティ、利用可能性の点で、エッジAIアプリケーションに最適な解決策として紹介されています。

プレゼンテーションでは、人間と機械のインタラクションとJetsonプラットフォームの改善についても触れ、さまざまな機械学習フレームワークやライブラリのサポートについて説明します。また、ビジョントランスフォーマー(VIT)のリアルタイムパフォーマンスの最適化を実演し、スマート交通システム、ベビーモニター、自動運転ナビゲーションなどの分野でのアプリケーションを紹介しています。

Dustyはまた、大規模言語モデルについても議論し、Jetson AGX Orinでのそのパフォーマンスを紹介し、異なるメモリ容量に基づいて異なるJetsonモジュールに適したモデルについて説明しています。テキストと画像処理方法の統合についても話し、AIアプリケーションにおけるJetsonプラットフォームの柔軟性と低遅延を強調しています。

最後に、自動音声認識、画像とテキストの埋め込み、リアルタイム対話型チャット管理などのアプリケーションについての概要を提供し、聴衆に質問をしてフォーラムやGitHubでのさらなる参加を促してプレゼンテーションを終えています。

tutorial

Introduction - NVIDIA Jetson Generative AI Lab