Category
文字起こし・音声認識
音声・動画の内容を高精度にテキスト化するAIサービス。会議録・インタビュー・講演の書き起こし作業を自動化し、議事録作成を効率化します。
Otter.ai
無料〜 $20/月
Whisper (OpenAI)
$0.006/分(API)/ OSS無料
Fireflies.ai
無料〜 $10/月
Notta
無料〜 $13.99/月
tl;dv
無料〜 $18/月
Tactiq
無料〜 $8/月
Descript
無料〜 $12/月
AssemblyAI
$0.65/時間〜(従量課金)
料金・機能を表で一括比較したい方へ
無料プラン・日本語対応・API提供などを比較表でチェック
よくある質問
OpenAIのWhisperをベースにしたサービスは英語の精度が特に高く(WER 5%以下)、日本語も実用レベルです。Notta・Otter.ai・Descript等は話者識別・タイムスタンプ付き文字起こしにも対応しています。発話の明瞭さや背景雑音によって精度は変わります。
Notta・tl;dv・Tactiqなどは会議録音ファイルをアップロードして文字起こしできます。Zoom本体にも自動文字起こし機能があります。tl;dvはZoom・Teamsに直接連携してリアルタイム文字起こし・要約も可能です。
Notta・Otter.aiなど主要サービスは日本語対応しており、クリアな発音であれば90%以上の精度が出ることも多いです。ただし専門用語・方言・早口な発話は精度が落ちる場合があるため、重要な書類への使用は必ず校正が必要です。
Notta(月120分無料)・Otter.ai(月600分無料)・Google Document(音声入力機能・無料)など無料で試せるサービスがあります。OpenAIのWhisperはオープンソースのため自己ホストすれば無料で使えます。