pdf-icon

StackFlow AI プラットフォーム

アプリケーション

CVビジョンアプリケーション

VLMマルチモーダル

大規模言語モデル (LLM)

音声アシスタント

自動音声認識(Automatic Speech Recognition)

説明

自動音声認識(ASR)モデルは、話し言葉をテキストに変換することを目的としています。これらのモデルは、文字起こしサービス、音声制御システム、支援ツールなど、さまざまなシーンで広く利用されています。

利用可能な CPU モデル

llm-model-sherpa-ncnn-streaming-zipformer-20m-2023-02-17

対応プラットフォーム:LLM630 Compute Kit、Module LLM、Module LLM Kit、および AI Pyramid

  • 本モデルは Zipformer アーキテクチャに基づくストリーミング ASR モデルで、大規模データセットを用いて学習されており、高精度な音声認識性能を提供します。
  • 本モデルは英語のみ対応です。

インストール

apt install llm-model-sherpa-ncnn-streaming-zipformer-20m-2023-02-17

llm-model-sherpa-ncnn-streaming-zipformer-zh-14m-2023-02-23

対応プラットフォーム:LLM630 Compute Kit、Module LLM、Module LLM Kit、および AI Pyramid

  • 本モデルは Zipformer アーキテクチャに基づくストリーミング ASR モデルで、大規模データセットを用いて学習されており、高精度な音声認識性能を提供します。
  • 本モデルは中国語のみ対応です。

インストール

apt install llm-model-sherpa-ncnn-streaming-zipformer-zh-14m-2023-02-23
On This Page