紹介
Qwen3-VL は、Qwen シリーズの中で最も強力な視覚言語モデルです。本世代では、テキスト理解・生成能力の向上、視覚認識および推論能力の深化、より長いコンテキスト長、空間および動画の動的理解能力の強化、さらに高度なエージェント対話能力など、全方位にわたるアップグレードを実現しています。
利用可能な NPU モデル
INT4 量子化モデル
qwen3-vl-2b-int4-ax650
- 1152 長のコンテキストウィンドウを提供
- 最大出力 2048 トークン
- 対応プラットフォーム:AI Pyramid
- 実行時間(TTFT):約 159.79ms
- 平均生成速度:約 11.93 token/s
- 画像エンコードサイズ:384×384
- 画像エンコード時間:190.73 ミリ秒
インストール
apt install llm-model-qwen3-vl-2b-int4-ax650