pdf-icon

StackFlow AI プラットフォーム

アプリケーション

CVビジョンアプリケーション

VLMマルチモーダル

大規模言語モデル (LLM)

音声アシスタント

InternVL3-1B

紹介

InternVL3 は、先進的なマルチモーダル大規模言語モデル(MLLM)シリーズであり、卓越した総合性能を示しています。InternVL 2.5 と比較して、InternVL3 はマルチモーダルな知覚および推論能力においてさらに優れた性能を発揮し、ツール利用、GUI エージェント、産業用画像解析、三次元視覚認識など、多様な方向へマルチモーダル能力を一層拡張しています。

利用可能な NPU モデル

ベースモデル(Base Model)

internvl3-1B-448-ax630c

ベースモデル は 1024 のコンテキストウィンドウを提供し、最大 1280 トークンを出力できます。
対応プラットフォーム:LLM630 Compute Kit、Module LLM、Module LLM Kit

  • コンテキストウィンドウ:1024
  • 最大出力トークン数:1280
  • 初回生成レイテンシ(ttft):534.95 ミリ秒
  • 平均生成速度:9.78 token/s
  • 画像エンコードサイズ:448×448
  • 画像エンコード時間:2267.89 ミリ秒

インストール

apt install llm-model-internvl3-1b-448-ax630c

internvl3-1B-448-ax650

ベースモデル は 2048 のコンテキストウィンドウを提供し、最大 2048 トークンを出力できます。
対応プラットフォーム:AI Pyramid

  • コンテキストウィンドウ:2048
  • 最大出力トークン数:2048
  • 初回生成レイテンシ(ttft):142.32 ミリ秒
  • 平均生成速度:26.67 token/s
  • 画像エンコードサイズ:448×448
  • 画像エンコード時間:393.08 ミリ秒

インストール

apt install llm-model-internvl3-1b-448-ax630c
On This Page