pdf-icon

StackFlow AI プラットフォーム

アプリケーション

CVビジョンアプリケーション

VLMマルチモーダル

大規模言語モデル (LLM)

音声アシスタント

Silero-vad

説明

Silero VAD(音声活動検出)は、音声ストリーム内に人の声が含まれているかどうかを検出するためのモデルです。音声アシスタント、文字起こしサービス、音声処理タスクなど、音声区間と非音声区間を区別する必要があるアプリケーションシナリオに適しています。

利用可能な CPU モデル

llm-model-silero-vad

  • 英語、中国語、日本語を含む多言語の音声検出をサポートします。
  • 対応プラットフォーム:LLM630 計算キット、Module LLM、Module LLM Kit、および AI Pyramid

インストール

apt install llm-model-silero-vad
On This Page