
StackFlow AI プラットフォーム
Whisper は、事前学習済みの自動音声認識(ASR)および音声翻訳モデルです。このモデルは 680,000 時間のラベル付きデータを基にトレーニングされ、微調整なしで多様なデータセットや分野に対して高い汎化能力を発揮します。
対応プラットフォーム:LLM630 コンピューティングキット、Module LLM および Module LLM キット
本モデルは多言語の音声認識および翻訳をサポートします。
エンコード時間:660.31 ミリ秒
平均デコード時間:51.11 ミリ秒
apt install llm-model-whisper-base sudo apt install llm-model-whisper-base-axcl