
StackFlow AI プラットフォーム
Whisper は、事前学習済みの自動音声認識(ASR)および音声翻訳モデルです。680,000 時間分のラベル付きデータで訓練され、微調整なしで多様なデータセットや領域に対して強力な汎化性能を示します。
このモデルは多言語音声認識および翻訳をサポートします。
エンコード時間:1606.08 ミリ秒
平均デコード時間:148.92 ミリ秒
apt install llm-model-whisper-small sudo apt install llm-model-whisper-small-axcl