OpenAIが提供する「Whisper」は、音声認識を行うためのオープンソースモデルです。 Pythonを使うことで、音声ファイルから簡単に文字起こしが可能です。 Whisperをそのまま使うと解析速度が遅いため、faster-whisperを使って高速化します。 faster-whisperは、Transformerモデル用の高速推論エンジンであるCTranslate2を使用してOpenAIのWhisperモデルを再実装したものです。 以下はGoogle Colaboratoryを利用してCPU利用で、 ...