2026 年に検証した無料文字起こしツール 11 選 — 上限・精度・対応フォーマット比較
2026 年に 5 言語で 11 種類の無料文字起こしツールを検証。日次/月次の上限、実測 WER 精度、対応エクスポート(SRT・VTT・TXT・DOCX)、登録不要で使えるツールを比較しました。
最終確認日: 2026-04-27。競合各社のプラン上限は、同日時点の各サービス公式の料金ページまたはヘルプ記事から引用しています。詳細は末尾の「出典・参考リンク」を参照してください。AI 文字起こしサービスはプラン構成が頻繁に変わるため、特定の数値に依存する場合は必ず出典リンクで最新情報を確認してください。
最適な無料文字起こしツールは、用途によって変わります。短い音声・動画ファイルなら、設定なしでアップロードしてテキスト出力できる Web ツールが便利です。オンライン動画なら、動画をダウンロードせずに公開 URL をそのままインポートできるツールを選ぶべきです。字幕用途なら、無料プランで SRT または VTT を書き出せるかを必ず確認してください。多言語の作業なら、文字起こし対応言語と翻訳エクスポートの両方をチェックしましょう。「無料」と謳っていても、英語しか扱えなかったり、エクスポートが有料プランに閉ざされているツールが少なくありません。
実用的な短いリストはこちらです。
- 総合的に最も使いやすい無料文字起こしツール: Vocova。音声・動画・URLインポート・100以上の文字起こし言語が必要で、ファイルが大きくなった場合のアップグレード経路まで明確にしたいユーザーに最適です。
- 登録不要・無制限の文字起こしツール: Riverside。対応形式のアップロードから素早く TXT または SRT を出力したい場合に。
- 技術ユーザー向けの無料オプション: OpenAI Whisper。ローカルでコマンドラインを動かすことに抵抗がない方に。
- 無料の会議記録ツール: Otter.ai。会議が短く、Basic プランの上限に収まるワークフローに向きます。
- 手軽なスマホ録音: Google Recorder。Pixel 端末ユーザーに。
クイック比較
| ツール | 無料での主な用途 | 無料プランで確認すべき上限 | 対応言語 | URLインポート | 無料エクスポート | 有料プランへの誘導 |
|---|---|---|---|---|---|---|
| Vocova | 音声/動画ファイル、オンライン動画、多言語の文字起こし結果 | 30分、保存3件、ファイル30 MBまで | 100以上の文字起こし言語 | 対応。YouTube、Bilibili、SoundCloud、Dailymotion、クラウドドライブなどの公開リンク | TXT | 話者ラベル、翻訳、PDF、DOCX、SRT、VTT、CSV、より大きなファイル、一括処理は Plus / Pro から |
| Riverside | アップロードから素早くトランスクリプトを得たい | 無料の文字起こし機能は寛大だが、スタジオ機能側はプラン制限あり | 100以上 | 一般的なURLインポートのワークフローはなし | TXT、SRT | 録画、編集、チーム、スタジオ系のワークフロー |
| OpenAI Whisper | フルコントロールでローカル処理 | サービス側の制限はなし。ハードウェアと環境構築は自分で用意 | 多言語対応。サポートが厚い言語ほど精度が高い | なし | ローカルツール経由で TXT、SRT、VTT、JSON | 基本的になし。ホスト型ラッパーを使う場合を除く |
| Otter.ai | 短時間・英語中心の会議とリアルタイムメモ | 月300分、1件あたり30分、アカウント全体で3件のファイルインポート | 会議向けの言語カバレッジ | 公開動画 URL のインポートはなし | Basicレベルのトランスクリプト閲覧 | 長尺ファイル、インポート増、チーム機能、エクスポート |
| Notta | 会議文字起こしのお試し | 月120分、1会話あたり3分、月50ファイル | 多言語の会議対応 | 一部の連携・アップロードフロー | 無料プランではエクスポートが限定的 | エクスポート、翻訳、長時間録音、上限拡張 |
| Google Recorder | スマホでの端末内録音 | Pixel 限定、ライブ録音中心 | 端末・地域によって対応言語が変わる | なし | TXT / Google ドキュメント形式 | 文字起こしサブスクではなく端末エコシステム側の話 |
| Happy Scribe | プロ向けトランスクリプト/字幕エディタの試用 | AI トランスクリプションを10分間だけお試し | 120以上のサービス対応 | 公開リンク/アップロード対応 | お試しの範囲のみ | 継続的な AI 文字起こし、字幕、翻訳、人手サービス |
1. Vocova
Vocova は、「無料で文字起こししたい」というニーズが単なるローカルの MP3 ファイルにとどまらない場合に最適です。音声ファイル、動画ファイル、そして公開 URL に対応しているため、リンクから始まる実務(YouTube インタビュー、Bilibili の講義、SoundCloud のエピソード、Dailymotion の動画、Google Drive の録音、ポッドキャストの URL など)にそのまま適用できます。
無料プランでは、自分の素材でワークフローを試すための30分が用意されています。タイムスタンプ、要約、トランスクリプトの編集、TXT エクスポートを含むため、課金前に精度・言語検出・実用性をしっかり評価できます。
おすすめ用途: 短時間の音声/動画文字起こし、多言語の検証、URLインポート。
無料プランの内容:
- 30分の文字起こしから始められます
- 保存できる文字起こしは3件まで
- ファイルサイズ最大30 MB(一般的な音声で約5〜10分、または短い動画クリップ)
- 100以上の話し言葉に対応、言語自動検出
- TXT エクスポート
- アップロードまたは公開 URL の貼り付け
Plus / Pro が効いてくる場面: 実際のところ、無料プランで最初に当たる壁は分数ではなくファイルサイズであることがほとんどです。1時間のインタビュー、ポッドキャスト1本、収録済みウェビナー、長尺講義は、ほぼ確実に 30 MB を超えます。Plus は 月額 $15 または年額 $90(年払いで月額 $7.50) で、月1,800分の文字起こし、5 GB までのファイル、すべてのエクスポート形式(TXT、PDF、DOCX、SRT、VTT、CSV)、話者識別、140以上のターゲット言語への翻訳、バイリンガル出力、最大20ファイルの一括アップロードが解放されます。Pro は 月額 $39、年額 $228、または lifetime $399 で、同じ有料機能セットに加え、より高ボリュームな業務向けに無制限の文字起こしを提供します。
ファイルからの文字起こしは audio to text、動画アップロードは video to text、すでにオンラインにある素材なら transcribe online media by link から始めるのが手軽です。プラットフォーム別ガイドは how to transcribe Bilibili videos と how to transcribe audio in multiple languages を参照してください。
2. Riverside
Riverside は本来、収録・編集プラットフォームですが、無料の AI 文字起こし機能は対応形式のアップロードから素早くトランスクリプトを得たい場面で役立ちます。同社によれば、無料の文字起こしは100以上の言語に対応し、利用回数に制限がなく、TXT または SRT をダウンロードできます。フルワークフローを構築せずに、トランスクリプトや字幕ファイルだけを手早く欲しいクリエイターには有力な選択肢です。
おすすめ用途: 対応形式の音声/動画アップロードから、TXT または SRT を素早く得たい場合。
無料プランの内容:
- 無料の AI 文字起こし機能
- 100以上の言語
- TXT および SRT のダウンロード
- ポッドキャスト、インタビュー、ウェビナー、動画コンテンツに適合
注意点: ダウンロードを避けたい公開プラットフォームの URL を起点にする場合、Riverside はあまりスマートな選択肢ではありません。また、収録・編集側のプラットフォームは別のプラン体系を持つため、文字起こしツールとしてだけでなくスタジオ製品としても評価する必要があります。
3. OpenAI Whisper
Whisper は、パイプライン全体を自分で制御したい技術ユーザーにとって最良の無料オプションです。オープンソースでローカル実行でき、コマンドラインツール経由でテキストや字幕を出力できます。サードパーティの Web アプリにアップロードせずプライベートなファイルを文字起こしできるため、機密性の高い録音にも有効です。
おすすめ用途: 開発者、研究者、ローカルセットアップに抵抗がないユーザー。
無料プランの内容:
- オープンソースのモデルとコード
- 自分で動かせばローカル処理が可能
- 多言語の音声認識と英語への翻訳機能
- ラッパー次第で TXT、SRT、VTT、JSON など主要形式に対応
注意点: Whisper 単体では完成された製品ではありません。依存関係のインストール、モデルサイズの管理、長尺ファイルの取り回し、編集・エクスポートのワークフロー構築をすべて自分で行う必要があります。標準では話者ラベルも付与されません。非技術者にとっては、ホスト型の文字起こし製品の方が圧倒的に速い場合がほとんどです。
4. Otter.ai
Otter.ai は短い会議に強い無料サービスです。リアルタイムメモや、使い慣れた会議アシスタント的なワークフローを求める場合に向いています。Basic 無料プランでは月300分の文字起こしが可能ですが、1件あたりの上限は30分、ファイルインポートはアカウント生涯で3件までという制約があります。
おすすめ用途: 短時間の会議とリアルタイムのメモ取り。
無料プランの内容:
- 月300分の文字起こし
- 1件あたり30分の上限
- アカウント生涯で3件の音声/動画ファイルインポート
- 会議向けに最適化されたトランスクリプト体験
注意点: 鍵となるのはファイルインポートの上限です。実際のユースケースが「アップロードした録音」「オンライン動画」「ポッドキャスト音源」「長尺インタビュー」の文字起こしであるなら、無料プランはあっという間に使い切れます。Otter は会議アシスタントとして使うときに最も真価を発揮します。汎用メディアの文字起こしツールではありません。
より詳細な比較は Otter.ai vs Vocova を参照してください。
5. Notta
Notta も会議向けの文字起こしツールです。無料プランは UI を試すには便利ですが、実用上の制限はかなりタイトです。月120分、1会話あたり最大3分、月50ファイルまで。実務よりは評価用途に向きます。
おすすめ用途: 有料プランへ移る前に、会議用文字起こしの UI を試す。
無料プランの内容:
- 月120分の文字起こし
- 1会話あたり最大3分
- 月50ファイルのアップロード
- 会議連携と話者識別
注意点: 1会話3分という上限は、インタビュー、授業、ポッドキャスト、顧客電話のほとんどには短すぎます。エクスポートと翻訳も有料プラン側に置かれているため、無料プランは「お試しサンプル」であり、継続的に使える無料文字起こし環境ではありません。
6. Google Recorder
Google Recorder は、Pixel スマホからワークフローが始まる場合に優れています。端末上で録音と文字起こしを行い、録音内容を検索でき、対応言語も端末・地域に応じて拡大しています。
おすすめ用途: Pixel 端末でのスマホ録音。
無料プランの内容:
- 対応 Pixel 端末で無料
- ライブ録音と文字起こし
- 録音内容の検索
- Google エコシステム経由でのエクスポート/共有
注意点: 汎用 Web 文字起こしツールではありません。Bilibili、YouTube、SoundCloud、Drive の URL を貼り付けて使うことはできません。字幕エクスポート、話者ラベル、翻訳、一括処理を備えるトランスクリプトエディタの代替にもなりません。
7. Happy Scribe
Happy Scribe は AI、翻訳、人手サービスを備えた洗練された文字起こし・字幕エディタです。無料プランは「トライアル」と捉えるのが正確で、AI 文字起こし、字幕、翻訳の10分間お試しが含まれます。
おすすめ用途: プロ向けのトランスクリプト/字幕エディタを試したい場合。
無料プランの内容:
- AI 10分間のお試し
- AI 文字起こし、字幕、翻訳のお試し利用
- トランスクリプト校正と字幕に最適化されたエディタ
注意点: 10分は品質を試すには十分ですが、継続的な無料運用には足りません。文字起こしのニーズが日常的に発生するなら、有料プランへの移行が前提となります。
詳細な製品比較は Happy Scribe vs Vocova を参照してください。
ユースケース別おすすめ無料ツール
| ユースケース | おすすめの起点 | 理由 |
|---|---|---|
| 短い音声ファイルからテキスト | Vocova audio to text | 簡単な Web アップロード、100以上の言語、無料プランで TXT エクスポート |
| 短い動画ファイルからテキスト | Vocova video to text | 動画ファイルに対応し、同じトランスクリプトエディタへ流し込める |
| オンライン動画のトランスクリプト | Vocova link import | ダウンロード→再アップロードの手間を回避 |
| Bilibili のトランスクリプト | Transcribe Bilibili | Bilibili URL 専用フロー |
| SoundCloud のトランスクリプト | Transcribe SoundCloud | 公開 SoundCloud リンクに最適化 |
| トランスクリプトから字幕ファイル | SRT generator または VTT generator | 動画プラットフォームやエディタ向けの字幕形式を生成 |
| 多言語の文字起こし | Vocova audio to text | 100以上の言語で言語自動検出 |
| 文字起こし後の翻訳 | Translate audio | Plus / Pro で140以上のターゲット言語へ翻訳 |
| ローカル/オフラインの技術ワークフロー | Whisper | ホスト型サービスが不要 |
| Pixel での音声メモ | Google Recorder | Pixel から録音を始めるなら最短ルート |
時間を無駄にしないツールの選び方
次の判断ルールを使ってください。
- 素材がすでにオンラインにあるなら、アップロード専用ツールは避ける。 公開 URL の貼り付けに対応するワークフローを選びましょう。
- 字幕が必要なら、SRT/VTT エクスポートを最初に確認する。 画面表示だけ可能で、字幕ファイルのエクスポートは有料というツールは多いです。
- 翻訳が必要なら、無料に含まれているか有料壁の向こう側かを確認する。 文字起こしと翻訳は別料金になっていることがよくあります。
- ファイルが30分超なら、実際の上限を確認する。 1ファイルあたりの長さ、インポート数、エクスポート上限に当たるまで気付かないケースが多々あります。
- プライバシーが最優先で、技術力があるならローカルモデルを使う。 Whisper は自分で運用できる方に最も柔軟な無料選択肢です。
無料プランがわかりにくいのはなぜか
「無料の文字起こし」は、文脈によって意味が大きく異なります。
- 継続利用できる本物のフリーティア
- 一度きりのトライアル
- 文字起こしは無制限だが、まともなエクスポートがない
- 分数は多いが、1ファイルの上限が短い
- ライブ会議の文字起こしのみで、アップロードは不可
- アップロードのみで、URLインポート不可
- トランスクリプト閲覧は無料だが、SRT/VTT/PDF/DOCX のエクスポートは有料
だからこそ、上の比較表では分数、ファイル上限、URLインポート、対応言語、エクスポートを別々に記載しています。最も重要なのは「無料かどうか」ではなく、「無料プランで自分の仕事を完了できるか」です。
よくある質問
2026年で最高の無料文字起こしツールは?
ほとんどのユーザーにとって、Vocova が総合的な出発点として最適です。音声ファイル、動画ファイル、公開 URL のインポート、100以上の文字起こし言語、無料プランの TXT エクスポートに対応しているためです。素早い無料 TXT/SRT 文字起こしには Riverside、ローカルでの制御を望み技術的なセットアップに抵抗がないなら Whisper が良いでしょう。
動画から文字起こしする最高の無料ツールは?
動画アップロードとオンライン動画インポートの両方に対応するツールを選ぶのが鉄則です。素材がすでに YouTube、Bilibili、SoundCloud、Dailymotion、クラウドドライブにあるなら、動画をダウンロードして再アップロードするより、URL インポート方式の方が圧倒的に速いです。ローカルファイルなら video to text、各プラットフォームの公開リンクなら transcribe Bilibili、transcribe SoundCloud、transcribe Dailymotion から始めましょう。
英語以外の言語も無料で文字起こしできますか?
できます。Vocova は無料プランでも100以上の言語の文字起こしに対応し、言語自動検出が利用できます。Riverside も無料の文字起こし機能で100以上の言語をうたっています。Whisper は自分で動かせば多言語の音声認識が可能です。会議系ツールは対応言語が狭かったり、プランに依存することがあるため、必ず実際の言語・アクセントで試してください。精度は言語によって変わります。WER ティア別の精度比較は transcription accuracy by language、多言語ワークフローの全体像は how to transcribe audio in multiple languages を参照してください。
無料の文字起こしツールで字幕は作れますか?
一部は可能です。Riverside の無料文字起こしは TXT と SRT をダウンロードできます。Whisper はローカルツール経由で SRT/VTT を生成できます。Vocova は無料プランで TXT エクスポートに対応し、SRT と VTT のエクスポートは Plus / Pro で利用できます。字幕がゴールなら、トランスクリプトを編集する前に SRT/VTT エクスポートの可否を必ず確認してください。
Bilibili におすすめの無料文字起こしツールは?
Transcribe Bilibili を使ってください。汎用の文字起こしツールの多くはファイルアップロードや YouTube 風 URL を前提に設計されており、Bilibili のリンクをきれいに扱えません。BV... 形式の ID、b23.tv の短縮 URL、m.bilibili のモバイル URL でつまずきがちです。公開 Bilibili 動画からトランスクリプト、字幕、英語翻訳が必要なときは、Bilibili 専用のフローが圧倒的に確実です。UP主(クリエイター)名、ファンダム特有の俗語、中国語と英語のコードスイッチング(言語の切り替え)への対処を含むステップバイステップは how to transcribe Bilibili videos を参照してください。
無料の文字起こしツールはプロの仕事に十分な精度ですか?
下書き、メモ、コンテンツの再利用、検索可能なアーカイブには十分な精度が出せます。出版、法務、医療、学術、対顧客の成果物には、トランスクリプトの校正を前提にしてください。精度は無料か有料かよりも、音声品質、話者の重なり、訛り、言語に大きく依存します。
無料ツールはアップロードした音声を保持しますか?
ポリシーは各社で異なります。クラウドツールはサーバー側で処理し、それぞれ独自の保持方針を持ちます。Whisper のようなローカルツールは完全に自分のマシンだけで完結できます。プライバシーが最重要なら、各ベンダーのデータポリシーを必ず読み、機密ファイルにはローカル処理を使ってください。
出典・参考リンク
外部(競合各社のプラン上限。すべて 2026-04-27 時点で確認):
- Riverside AI transcription
- Otter.ai Basic free plan limits
- Notta pricing
- Google Recorder transcription help
- Happy Scribe plans and pricing
- OpenAI Whisper release
Vocova 関連ガイド:
