会議の議事録作成、インタビューの文字起こし、動画の字幕制作――これまで手間のかかる作業でしたが、AI文字起こしツールを使えば数分で自動テキスト化できます。しかも今は無料で使えるツールが充実しています。この記事では2026年時点で無料利用できるAI文字起こしツール5選を比較し、用途別のおすすめを解説します。

無料AI文字起こしツール 比較一覧(5選)

ツール無料枠日本語精度話者分離特徴
Whisper(OpenAI)完全無料(ローカル実行)△(別途設定)オープンソース。ローカルで動くため情報漏洩リスクゼロ
CLOVA Note月300分まで無料◎(自動)LINE(NAVER)製。日本語に特化、話者分離が優秀
Notta月120分まで無料58言語対応。要約機能・AIアシスタント付き
AssemblyAI無料APIクレジットありAPI連携・自動化向け。感情分析・要約・章立て機能付き
Google Speech-to-Text月60分まで無料Google Cloud連携。精度が高くGoogleエコシステムと親和性◎

1. Whisper(OpenAI)― ローカル完全無料の最強エンジン

概要

WhisperはOpenAIが公開したオープンソースの音声認識モデルです。自分のPC上で動かすため、音声データをクラウドに送らずに済み、機密性の高い会議録にも安心して使えます。

メリット

  • 完全無料・制限なし(利用分数の上限なし)
  • 日本語の認識精度がトップクラス
  • 機密情報を含む音声もローカル処理で安全
  • 多言語に対応(99言語以上)

デメリット

  • PCへのインストールとコマンドライン操作が必要(非エンジニアには敷居が高い)
  • 話者分離(誰が話したかの判別)は標準では非対応
  • 処理速度はPCのスペックに依存

使い方(簡易版)

# Python環境が必要
pip install openai-whisper
whisper audio.mp4 --language ja --model medium

GUIで使いたい場合は「Whisper Web」「Whisper Transcriber」など、ブラウザ上で動くラッパーツールも無料で利用できます。

2. CLOVA Note ― 日本語特化・話者分離が優秀な無料ツール

概要

CLOVA NoteはLINEヤフーが提供するAI文字起こしサービスです。日本語の精度と話者分離が特に優秀で、複数人での会議録作成に最適です。

メリット

  • 無料で月300分まで利用可能(1ファイル最大60分)
  • 話者を自動で分離し「Aさん:〜」「Bさん:〜」の形式で出力
  • ブラウザ上で完結(インストール不要)
  • スマートフォンアプリでリアルタイム文字起こしも可能
  • テキストのダウンロード・共有が簡単

デメリット

  • 月300分を超えると有料(1,650円/月〜)
  • 日本語・英語・韓国語が中心(多言語は限定的)
  • 音声データがサーバーに送信されるため機密性には注意

使い方

  1. CLOVA Note(clovanote.naver.com)にLINEアカウントでログイン
  2. 「+新規ノート」から音声・動画ファイルをアップロード
  3. 自動で文字起こし開始。完了後にダウンロード

3. Notta ― 多言語対応と要約機能が便利な無料プラン

概要

Nottaは58言語対応の文字起こしサービスです。無料プランでも月120分利用でき、AI要約機能が付いている点が特徴です。

メリット

  • 無料で月120分利用可能
  • 58言語対応(外国語インタビューにも対応)
  • 文字起こし後にAIが自動要約を生成
  • Zoom・Google Meet・Microsoft Teamsのミーティング録音を直接取り込み可
  • ブラウザ・スマホアプリ両方で利用可能

デメリット

  • 無料枠は月120分(週単位でリセット)
  • 無料プランは1ファイル最大3分の制限あり(長い録音は分割が必要)
  • 有料プランは$13.99/月〜

4. AssemblyAI ― 自動化・API連携したい開発者向け

概要

AssemblyAIはAPIで提供される文字起こしサービスで、開発者・事業者向けの機能が充実しています。無料APIクレジットが付与されており、試験利用や小規模な自動化ならコストゼロで始められます。

メリット

  • 無料APIクレジットで試験利用が可能
  • 話者分離(Speaker Diarization)の精度が業界トップクラス
  • 感情分析・トピック検出・自動章立て・要約などの付加機能が豊富
  • SlackやNotion・Zapierとの連携が容易
  • 日本語を含む複数言語に対応

デメリット

  • APIキーの取得とコード実装が必要(非エンジニアには敷居が高い)
  • 無料クレジットを超えると従量課金($0.65/時間〜)
  • GUIツールがないためブラウザだけで完結しない

こんな用途に向いている

「文字起こし→要約→Slackに自動投稿」といったワークフロー自動化に最適です。Google Apps ScriptやMake(旧Integromat)からAPIを叩けば、会議終了後に自動で議事録が共有される仕組みを構築できます。

5. Google Speech-to-Text ― Google Cloud連携で精度と拡張性を両立

概要

GoogleのSpeech-to-Text APIはGoogle Cloudのサービスの一つで、月60分まで無料で利用できます。Googleが長年培った音声認識技術を活用しており、日本語・英語ともに高い精度を誇ります。

メリット

  • 月60分まで無料(Standardモデル)
  • Google製サービスとの連携がシームレス(Google Drive・Docs・Meet等)
  • 日本語精度が高く、句読点の自動挿入にも対応
  • リアルタイム文字起こしと録音ファイルの両方に対応
  • Enterprise規模まで対応するスケーラビリティ

デメリット

  • Google Cloudアカウントと初期設定が必要
  • 無料枠は月60分(超過分は$0.016/分〜)
  • APIベースのためGUI操作のみでは完結しない

こんな用途に向いている

Google Workspaceをフル活用している企業・チームに最適です。Google Meetの録画を自動文字起こし→Google Docsに保存、といったGoogle製品との一気通貫フローを構築しやすい環境です。

用途別おすすめ

用途おすすめツール理由
機密性の高い社内会議Whisper(ローカル)データを外部送信しないため安全
複数人の会議録(話者分離重視)CLOVA Note話者分離精度が最も高く操作も簡単
インタビュー・外国語音声Notta58言語対応と要約機能が便利
業務ワークフローに自動化組み込みAssemblyAIAPI連携・感情分析・自動章立てが充実
Google Workspace利用企業Google STTGoogle製品との一気通貫フロー構築が容易
大量の文字起こし(制限なし)Whisper(ローカル)時間制限なし・完全無料
非エンジニアが手軽に使いたいCLOVA Note or Nottaブラウザだけで完結

精度を上げるコツ

  • 録音品質を上げる:マイクに近い位置で録音する。環境ノイズを減らす
  • 明瞭に話す:早口・方言・専門用語は認識ミスが増える
  • 専門用語はポスト編集する:固有名詞や業界用語は文字起こし後に手動修正が前提
  • 長い音声は分割する:1時間以上の録音は30分単位に分けると処理が安定する

まとめ

無料のAI文字起こしツールは2026年現在、十分実用的なレベルに達しています。

  • 機密情報を扱う・制限なしで使いたいなら → Whisper(ローカル)
  • 複数人会議・手軽に使いたいなら → CLOVA Note
  • 外国語・AI要約が欲しいなら → Notta
  • 自動化・API連携したいなら → AssemblyAI
  • Google Workspaceをフル活用なら → Google Speech-to-Text

まずは CLOVA Note の無料プランを試してみるのがもっとも手軽です。月300分あれば週1〜2回の会議録を処理するのに十分です。