Whisper-base

紹介

Whisper は、事前学習済みの自動音声認識（ASR）および音声翻訳モデルです。本モデルは 680,000 時間の注釈付きデータで学習されており、微調整を行わなくても、さまざまなデータセットや分野に対して高い汎化性能を発揮します。

利用可能な NPU モデル

whisper-base

対応プラットフォーム：LLM630 Compute Kit、Module LLM、Module LLM Kit

本モデルは多言語音声認識および翻訳をサポートします。
エンコード時間：660.31 ミリ秒
平均デコード時間：51.11 ミリ秒

インストール

apt install llm-model-whisper-base

llm-model-whisper-base をダウンロード

対応プラットフォーム：Raspberry Pi5

インストール

sudo apt install llm-model-whisper-base-axcl

llm-model-whisper-base-axcl をダウンロード

対応プラットフォーム：AI Pyramid

インストール

apt install llm-model-whisper-base-ax650

llm-model-whisper-base-ax650 をダウンロード

Page Tools

On This Page