説明
Whisper は、事前学習された自動音声認識(ASR)および音声翻訳モデルです。本モデルは 680,000 時間のラベル付きデータを用いて学習されており、微調整を行わなくても、さまざまなデータセットや分野に対して高い汎化性能を発揮します。
利用可能な NPU モデル
whisper-small
対応プラットフォーム:LLM630 Compute Kit、Module LLM、Module LLM Kit
- 本モデルは多言語音声認識および翻訳に対応しています。
- エンコード時間:1606.08 ミリ秒
- 平均デコード時間:148.92 ミリ秒
インストール
apt install llm-model-whisper-small
対応プラットフォーム:Raspberry Pi5
インストール
sudo apt install llm-model-whisper-small-axcl
対応プラットフォーム:AI Pyramid
インストール
apt install llm-model-whisper-small-ax650