pdf-icon

StackFlow AI プラットフォーム

アプリケーション

CVビジョンアプリケーション

VLMマルチモーダル

大規模言語モデル (LLM)

音声アシスタント

Qwen3-VL-2B-Instruct

紹介

Qwen3-VL は、Qwen シリーズの中で最も強力な視覚言語モデルです。本世代では、テキスト理解・生成能力の向上、視覚認識および推論能力の深化、より長いコンテキスト長、空間および動画の動的理解能力の強化、さらに高度なエージェント対話能力など、全方位にわたるアップグレードを実現しています。

利用可能な NPU モデル

INT4 量子化モデル

qwen3-vl-2b-int4-ax650

  • 1152 長のコンテキストウィンドウを提供
  • 最大出力 2048 トークン
  • 対応プラットフォーム:AI Pyramid
  • 実行時間(TTFT):約 159.79ms
  • 平均生成速度:約 11.93 token/s
  • 画像エンコードサイズ:384×384
  • 画像エンコード時間:190.73 ミリ秒

インストール

apt install llm-model-qwen3-vl-2b-int4-ax650
On This Page