pdf-icon

StackFlow AI プラットフォーム

アプリケーション

CVビジョンアプリケーション

VLMマルチモーダル

大規模言語モデル (LLM)

音声アシスタント

Whisper-base

紹介

Whisper は、事前学習済みの自動音声認識(ASR)および音声翻訳モデルです。本モデルは 680,000 時間の注釈付きデータで学習されており、微調整を行わなくても、さまざまなデータセットや分野に対して高い汎化性能を発揮します。

利用可能な NPU モデル

whisper-base

対応プラットフォーム:LLM630 Compute Kit、Module LLM、Module LLM Kit

  • 本モデルは多言語音声認識および翻訳をサポートします。
  • エンコード時間:660.31 ミリ秒
  • 平均デコード時間:51.11 ミリ秒

インストール

apt install llm-model-whisper-base

対応プラットフォーム:Raspberry Pi5

インストール

sudo apt install llm-model-whisper-base-axcl

対応プラットフォーム:AI Pyramid

インストール

apt install llm-model-whisper-base-ax650
On This Page