2026年、ベスト無料文字起こしツール7選
2026年のベスト無料文字起こしツール7選を比較。精度、言語サポート、使いやすさをそれぞれテストし、最適なツール選びをお手伝いします。
無料の文字起こしツールは、この1年で大幅に改善されました。モデルはより正確になり、言語サポートはより広くなり、いくつかのサービスは機能が制限されたトライアルではなく、本当に使える無料枠を提供するようになりました。
私たちは、複数の言語、音声品質レベル、ファイル形式にわたって、最も人気のある7つの無料文字起こしツールをテストしました。以下がその結果です。まず比較一覧を示し、続いて各ツールの詳細を見ていきます。
比較一覧
| ツール | 無料分数 | 言語 | 話者ラベル | エクスポート形式 | ファイルアップロード | プラットフォーム |
|---|---|---|---|---|---|---|
| Vocova | 120分/月 | 100以上 | Proのみ | TXT(無料)、PDF/SRT/VTT/DOCX/CSV(Pro) | あり(無料3ファイル) | ウェブ(全デバイス) |
| Otter.ai | 300分/月 | 英語のみ | あり | TXT | あり(生涯3回) | ウェブ、iOS、Android |
| Google Recorder | 無制限 | 8言語 | 限定的 | TXT、Google Docs | なし(ライブ録音のみ) | Pixelスマートフォンのみ |
| OpenAI Whisper | 無制限(セルフホスト) | 99言語 | なし | TXT、SRT、VTT、JSON | あり | デスクトップ(CLI) |
| Happy Scribe | 合計10分 | 120以上 | あり | なし(無料) | あり(1ファイル) | ウェブ |
| Notta | 200分/月 | 58言語 | あり | なし(無料) | あり(月50ファイル) | ウェブ、iOS、Android |
| Riverside | 無制限 | 100以上 | あり | TXT、SRT | あり | ウェブ |
1. Vocova
Vocovaは、自動言語検出付きで100以上の言語をサポートするウェブベースの文字起こしツールです。音声・映像ファイルを処理でき、YouTube、TikTok、Zoom、Teams、Google Meetを含む1,000以上のプラットフォームからURLを貼り付けて直接インポートすることもできます。
無料枠では、最大3つの文字起こしで月120分が提供され、TXTエクスポートが含まれます。多くの競合が苦手とする多言語コンテンツを扱う場合、特にたまに使用する程度であれば十分な量です。
最適な用途: インストール不要の多言語文字起こし。
無料枠の詳細:
- 月120分
- 3つのトランスクリプト
- TXTエクスポート
- 自動言語検出
- 100以上の言語
制限事項: 話者ラベル、高度なエクスポート形式(PDF、SRT、VTT、DOCX、CSV)、バッチアップロード、スタジオグレードの精度にはProプランが必要です。無料枠はトランスクリプトが合計3つに制限されるため、多数の短い録音よりも長い録音に適しています。
2. Otter.ai
Otter.aiは、AI文字起こしで最も確立された名前の1つです。英語の会議に強く焦点を当てており、ファイルアップロードに加えてリアルタイム文字起こしを提供しています。インターフェースは洗練されており、Zoom、Google Meet、Microsoft Teamsと直接連携します。
無料プランでは月300分が提供されますが、見た目ほど寛大ではありません。各会話は30分に制限され、音声・映像ファイルのインポートはアカウントの生涯で3回のみです。この3回のアップロードを使い切ると、アップグレードなしにはファイルをインポートできなくなります。
最適な用途: リアルタイムキャプチャ付きの英語のみの会議文字起こし。
無料枠の詳細:
- 月300分
- 会話あたり30分上限
- 3回のファイルアップロード(月ごとではなく生涯)
- 基本的な検索と再生
制限事項: 無料プランでは英語のみ。ファイルインポートの生涯上限は、事前録音されたコンテンツの文字起こしに大きな制約です。無料枠では基本的なテキスト以外のエクスポートオプションはありません。詳しい比較はOtter.ai vs Vocovaをご覧ください。
3. Google Recorder
Google Recorderは、Pixelスマートフォン専用の無料アプリです。デバイス上で直接リアルタイムに文字起こしするため、インターネット接続なしでも動作します。文字起こしは高速で、インターフェースにより録音をキーワードで簡単に検索できます。
Pixelフォンで録音する英語コンテンツについては、カジュアルな使用では他に勝るものがありません。分数制限、サブスクリプション、広告はありません。アプリは音楽や拍手などのサウンドもタグ付けします。
最適な用途: Pixelフォンでの素早いデバイス上録音。
無料枠の詳細:
- 完全無料、録音制限なし
- デバイス上処理(オフライン動作)
- TXTとGoogle Docsへのエクスポート
- 新しいPixelモデルでの要約生成
制限事項: Google Pixelフォンでのみ利用可能。言語サポートはデバイスモデルと地域によって約8言語に制限されています。話者識別は最小限です。1時間以上の録音の文字起こしは不安定になる可能性があり、古いデバイスでは15分を超えるものに苦労します。ウェブインターフェースはなく、事前録音されたファイルをアップロードする方法もありません。
4. OpenAI Whisper
Whisperは、OpenAIがリリースしたオープンソースの音声認識モデルです。99言語をサポートし、アクセントのある発話、バックグラウンドノイズ、技術的な語彙を多くの商用ツールより上手に処理できます。自分で実行するため、無料で使用できます。
コマンドラインに慣れていれば、Whisperは非常にパワフルです。large-v3モデルは、ほとんどの有料サービスに匹敵またはそれを超える精度を提供します。サポートされている任意の言語からの音声を英語に翻訳することもできます。
最適な用途: 最大限の精度とデータの完全なコントロールを求める技術的なユーザー。
無料枠の詳細:
- 完全無料(オープンソース)
- 英語への翻訳付き99言語
- 速度/精度のトレードオフに応じた複数のモデルサイズ
- TXT、SRT、VTT、JSONでの出力
制限事項: 妥当な速度のためにはそれなりのGPUを搭載したコンピューターが必要です(またはCPUのみの処理で忍耐が必要)。そのままではグラフィカルインターフェースがありません。話者ラベルなし。リアルタイム文字起こしなし。インストール、アップデート、トラブルシューティングを自分で処理する必要があります。技術的でないユーザーには適していません。
5. Happy Scribe
Happy Scribeは、ヨーロッパに拠点を置くプロフェッショナルな文字起こしおよび字幕プラットフォームです。120以上の言語をサポートし、AI生成と人間による文字起こしの両方を提供しています。エディターは良く設計されており、同期再生と簡単な修正ツールを備えています。
無料プランは、単一のファイルに対してわずか10分の合計文字起こしと、非常に限定的です。これは継続的な無料枠というよりもトライアルです。無料では文字起こしをエクスポートできません。
最適な用途: 有料プランにコミットする前にプロフェッショナルグレードのエディターをテストする。
無料枠の詳細:
- 合計10分(月ごとではなく1回限り)
- 1ファイルアップロード
- 120以上の言語でのAI文字起こし
- インタラクティブエディターへのアクセス
制限事項: 10分ではサービスを評価するのにかろうじて十分です。無料プランではエクスポート不可。分数を使い切ったら、続行するにはアップグレードが必要です。Basicの有料プランは月$17で120分からです。これは無料ツールではなくトライアルです。
6. Notta
Nottaは、文字起こしを中核としたAI会議アシスタントと位置づけています。58言語をサポートし、Zoom、Microsoft Teams、Google Meet、Webexと連携しています。インターフェースはクリーンで、会議に自動的に参加して録音・文字起こしできます。
無料プランでは月200分が提供されますが、各会話は3分に制限されており、ほとんどの実際の使用には非現実的です。月に最大50ファイルをアップロードできますが、3分の上限はそれらにも適用されます。無料プランではトランスクリプトをダウンロードできません。
最適な用途: 会議ボットが欲しく、テスト後にアップグレードする意思があるユーザー。
無料枠の詳細:
- 月200分
- 会話あたり3分上限
- 月50ファイルアップロード
- AI要約と話者識別
- トランスクリプトダウンロード不可
制限事項: 3分の会話上限により、無料プランは実際の文字起こし作業にはほぼ使用不可能です。アップグレードなしではエクスポート機能なし。Proは月$14.99から。詳しくはNotta vs Vocovaの比較をご覧ください。
7. Riverside
Riversideは主にポッドキャストおよびビデオ録画プラットフォームですが、分数制限なしの本当に無料の文字起こし機能も提供しています。100以上の言語をサポートし、無料ツールとしては珍しい話者ラベルを提供します。
文字起こし機能にはサインアップ不要で、TXTとSRT形式でエクスポートできます。クリアな音声での精度は堅実ですが、強いアクセントやノイズの多い環境では一部の競合より苦労する可能性があります。
最適な用途: 字幕付きの無制限無料文字起こしを必要とするポッドキャストクリエイターやその他のユーザー。
無料枠の詳細:
- 無制限の文字起こし分数
- サインアップ不要
- 100以上の言語
- 話者ラベル付き
- TXTとSRTエクスポート
制限事項: 文字起こしツールはRiversideの録画プラットフォームに副次的なものであるため、専用の文字起こしサービスと比較して編集体験は基本的です。翻訳機能なし。ウェブベースのエディターにはHappy ScribeやOtter.aiにある修正ツールがありません。
適切な無料文字起こしツールの選び方
最適なツールは、実際に何が必要かによって異なります:
- 多言語コンテンツ: Vocova(自動検出付き100以上の言語)またはWhisper(セルフホストで99言語)が最も幅広いカバレッジを提供します。他のほとんどのツールは英語中心です。
- 英語の会議: Otter.aiが会議に特化した機能付きで最も多くの月間分数(300分)を提供しますが、ファイルインポートが不要な場合に限ります。
- 分数制限なし: RiversideとGoogle Recorderには月間上限がありませんが、Google RecorderはPixelデバイスに限定されています。
- 完全なデータ管理: Whisperは完全に自分のハードウェア上で動作します。何もマシンの外に出ません。
- 最も使える無料枠: 見出しの数字だけでなく、実際の制約を見てください。Nottaは200分を提供していますが、各会話を3分に制限しています。Otter.aiは300分を提供していますが、ファイルアップロードをアカウント全体で3回に制限しています。Vocovaは120分を提供し、使い方の制限がより少ないです。
よくある質問
最も正確な無料文字起こしツールはどれですか?
OpenAI Whisper(large-v3モデル)が一般的に最高の生精度を提供しますが、技術的なセットアップと高性能GPUが必要です。ウェブベースのツールの中では、VocovaとOtter.aiがクリアな音声で一貫してきれいなトランスクリプトを生成します。精度は音声品質、バックグラウンドノイズ、話者のアクセントによって大幅に異なるため、自分の録音でテストすることが常に価値があります。
英語以外の言語で無料で文字起こしできますか?
はい、ただし選択肢はかなり狭まります。Vocovaは自動言語検出付きで無料枠で100以上の言語をサポートしています。Whisperは自分で実行すれば99言語を処理します。他のほとんどの無料ツールは英語のみ(Otter.ai、Google Recorder)をサポートするか、言語サポートを有料プランに制限しています。AIが多言語文字起こしをどのように処理するかの詳細については、AI vs 人間の文字起こしガイドをご覧ください。
無料の文字起こしツールはプロフェッショナルな使用に十分な精度がありますか?
クリアな音声で話者が1人、バックグラウンドノイズが最小限の場合、最新のAI文字起こしツールは通常90〜95%の精度を達成しており、会議メモ、コンテンツの再利用、個人的な参照には十分です。法的、医療、出版品質のトランスクリプトについては、出力の校正と修正が必要になるか、人間によるレビュー付きの有料サービスを使用する必要があるでしょう。
無料の文字起こしツールは音声ファイルを保持しますか?
ポリシーはさまざまです。Otter.ai、Notta、Vocovaなどのクラウドベースのツールはサーバー上で音声を処理しますが、保持と削除のポリシーは異なります。Google Recorderはデバイス上で処理し、デフォルトでは音声をアップロードしません。Whisperは完全にローカルマシン上で動作します。プライバシーが懸念される場合は、各ツールのデータポリシーを確認するか、完全なコントロールのためにWhisperを使用してください。
無料の文字起こしツールで話者ラベルを取得できますか?
Riversideは無料プランで話者ラベルを提供しており、これは珍しいことです。Otter.aiは無料で基本的な話者識別を含みますが、英語のみです。他のほとんどのツールは話者ダイアライゼーションを有料枠に限定しています。VocovaはProプランに話者ラベルを含みます。話者識別が重要で無料で必要な場合、Riversideが現在最も強力な選択肢です。
YouTube動画を文字起こするのに最適な無料ツールはどれですか?
VocovaはURLを貼り付けることでYouTubeおよび1,000以上の他のプラットフォームからコンテンツをインポートして文字起こしでき、最も簡単なオプションの1つです。Whisperはダウンロードしたものを含む任意の音声ファイルを文字起こしできますが、手動ダウンロードとコマンドラインの使用が必要です。他のほとんどの無料ツールは、URLベースのインポートではなく、ライブ録音や直接のファイルアップロード向けに設計されています。