2026 年 11 款免費語音轉文字工具實測:精準度、輸出格式、無需註冊
我們在 2026 年實測 11 款免費語音轉文字工具,跨繁中、英、日、西、葡 5 種語言比較精準度,並列出每月限制、SRT/VTT/TXT/DOCX 輸出與是否需要註冊。
最後驗證日期:2026-04-27。各家競品的方案限制皆引用自當天各服務的定價或說明頁面,詳見文末「資料來源與延伸閱讀」。AI 語音轉文字產品的方案常常變動,依賴任何具體數字之前,請先回去確認原始來源。
最好的免費語音轉文字工具,要看你實際要做的事。短的音訊或影片檔案,挑一個能直接上傳並匯出文字、不必額外設定的網頁工具就好。線上影片要轉文字免費的話,挑可以匯入公開 URL 的工具,比逼你先下載影片再上傳更省事。要做字幕,先確認免費方案能不能輸出 SRT 或 VTT。多語言工作則要同時看轉錄語言與翻譯匯出,因為很多「免費」工具其實只支援英文,或把匯出鎖在付費方案裡。
以下是務實的精選名單:
- 整體最佳免費語音轉文字工具: Vocova,特別適合需要音訊、影片、URL 匯入、100+ 轉錄語言以及大檔案升級路徑的使用者。
- 無需註冊的最佳無限轉錄工具: Riverside,如果你只需要從支援的上傳檔案快速產出 TXT 或 SRT。
- 技術使用者的最佳免費選擇: OpenAI Whisper,如果你能自在地在本機跑命令列工作流程。
- 最佳免費會議錄音工具: Otter.ai,如果你的會議很短,Basic 限制剛好夠用。
- 最佳手機快速錄音工具: Google Recorder,如果你用的是 Pixel 手機。
快速比較
| 工具 | 最佳免費用途 | 需注意的免費限制 | 語言 | URL 匯入 | 免費匯出 | 升級壓力 |
|---|---|---|---|---|---|---|
| Vocova | 音訊/影片檔案、線上影片、多語言逐字稿 | 30 分鐘、3 個儲存的轉錄、檔案 30 MB | 100+ 轉錄語言 | 是,支援來自 YouTube、Bilibili、SoundCloud、Dailymotion、雲端硬碟等公開連結 | TXT | 講者識別、翻譯、PDF、DOCX、SRT、VTT、CSV、更大檔案與批次處理皆從 Plus / Pro 開始 |
| Riverside | 上傳即轉錄的快速任務 | 免費轉錄器條件相當寬鬆,但整個工作室產品有自己的方案限制 | 100+ | 沒有通用的 URL 匯入流程 | TXT、SRT | 錄音、剪輯、團隊與工作室工作流程 |
| OpenAI Whisper | 完全自控的本機轉錄 | 沒有服務端限制,但硬體與設定要自備 | 多語言,主流語言表現最佳 | 否 | 透過本機工具可輸出 TXT、SRT、VTT、JSON | 除非你使用代管服務,否則沒有付費壓力 |
| Otter.ai | 短會議與即時筆記,以英文為主 | 每月 300 分鐘、單次轉錄 30 分鐘、終身只能匯入 3 個檔案 | 偏向會議場景的語言覆蓋 | 沒有通用公開影片 URL 匯入 | 基本逐字稿存取 | 較長檔案、更多匯入、團隊功能與匯出工作流程 |
| Notta | 試用會議轉錄介面 | 每月 120 分鐘、單次對話 3 分鐘、每月 50 個檔案上傳 | 多語言會議支援 | 部分整合與上傳流程 | Free 上的匯出受限 | 匯出、翻譯、較長錄音與更大配額 |
| Google Recorder | 手機端裝置錄音 | 僅限 Pixel,以即時錄音為主 | 語言清單依裝置與地區而定 | 否 | TXT/Google 文件式工作流程 | 屬於裝置生態,不是訂閱型轉錄產品 |
| Happy Scribe | 試用專業逐字稿/字幕編輯器 | 10 分鐘 AI 試用 | 服務覆蓋 120+ 語言 | 公開連結/上傳工作流程 | 試用受限 | 持續性的 AI 轉錄、字幕、翻譯與人工服務 |
1. Vocova
Vocova 最適合那種「免費語音轉文字」需求不只是本機 MP3 的情況。它能處理音訊檔、影片檔以及公開 URL,這點很重要,因為很多真實任務一開始就是一條連結:YouTube 訪談、Bilibili 講座、SoundCloud 節目、Dailymotion 影片、Google Drive 錄音,或是 Podcast URL。
免費方案給你 30 分鐘,讓你用自己的素材測試整個流程。內建時間軸、摘要、逐字稿編輯與 TXT 匯出,這些已經足以在付費前評估準確度、語言偵測與這份轉錄結果是否真的有用。
最適合: 短音訊/影片轉錄、多語言測試與 URL 匯入。
免費方案細節:
- 30 分鐘的入門轉錄額度
- 最多 3 個儲存的轉錄
- 檔案最大 30 MB(大約 5–10 分鐘的一般音訊,或一段短影片)
- 支援 100 種以上的口語,並具備自動偵測
- TXT 匯出
- 上傳檔案或貼上公開 URL
Plus / Pro 重要在哪: 實務上免費使用者撞到付費牆的最常見原因是檔案大小,而不是分鐘數——一場 1 小時的訪談、一集 Podcast、一場錄製好的 webinar,或一場長講座,幾乎都會超過 30 MB。Plus 為每月 $15 或每年 $90(年付每月 $7.50),可解鎖每月 1,800 分鐘轉錄、檔案最大 5 GB、所有匯出格式(TXT、PDF、DOCX、SRT、VTT、CSV)、講者識別、翻譯到 140+ 種語言、雙語輸出,以及最多 20 個檔案的批次上傳。Pro 為每月 $39、每年 $228 或一次買斷 $399 lifetime,並加上無限轉錄,適合更大量的工作,付費功能與 Plus 相同。
如果是檔案,從 audio to text 開始;如果是影片上傳,用 video to text;如果素材已經在線上,看 transcribe online media by link。平台專屬指南可看 how to transcribe Bilibili videos 與 how to transcribe audio in multiple languages。
2. Riverside
Riverside 主要是錄音與剪輯平台,但它的免費 AI 轉錄器在你需要從支援的上傳檔案快速取得逐字稿時很實用。Riverside 表示其免費轉錄器支援 100+ 語言、可以無限使用,並能下載 TXT 或 SRT 檔案。對於想要快速取得逐字稿或字幕檔,但不想搭建完整工作流程的創作者來說,這是強力選擇。
最適合: 從支援的音訊/影片上傳檔案快速產出 TXT 或 SRT。
免費方案細節:
- 免費 AI 轉錄器
- 100+ 語言
- TXT 與 SRT 下載
- 適合 Podcast、訪談、webinar 與影片內容
限制: 如果你的起點是不想先下載的公開平台 URL,Riverside 並不是最乾淨的選擇。它的錄音與剪輯平台還有自己的方案結構,所以建議把它同時當作轉錄工具與工作室產品來評估。
3. OpenAI Whisper
對想完全掌控整條管線的技術使用者而言,Whisper 是最好的免費語音轉文字選擇。它是開源的、可以在本機跑,並能透過命令列工具產出文字與字幕輸出。你可以在不上傳到第三方網頁應用的情況下轉錄私人檔案,這對敏感錄音特別有價值。
最適合: 開發者、研究者,以及能輕鬆完成本機設定的使用者。
免費方案細節:
- 開源模型與程式碼
- 自行運行時可在本機處理
- 多語言語音辨識,並具備翻譯成英文的能力
- 依你使用的封裝工具,常見輸出包含 TXT、SRT、VTT 與 JSON
限制: Whisper 本身不是一個打磨完整的產品。你得自己安裝相依套件、管理模型大小、處理長檔案,並打造自己的編輯/匯出流程。預設也不提供說話者識別。對非技術使用者而言,代管型轉錄產品通常更快。
4. Otter.ai
如果你想要即時筆記與熟悉的會議助理體驗,Otter.ai 是短會議的強力免費選擇。Basic 免費方案每月可用 300 分鐘的轉錄,但每段轉錄上限為 30 分鐘,且每個帳號終身只能匯入 3 個檔案。
最適合: 短會議與即時筆記。
免費方案細節:
- 每月 300 分鐘轉錄
- 單次轉錄 30 分鐘上限
- 終身 3 個音訊/影片檔案匯入
- 以會議為導向的逐字稿體驗
限制: 檔案匯入上限是關鍵陷阱。如果你真正的需求是轉錄上傳的錄音、線上影片、Podcast 檔案或長訪談,免費方案很快就會用光。Otter 最強的場景是當作會議助理,而非通用的媒體轉錄工具。
更深入的比較請看 Otter.ai vs Vocova。
5. Notta
Notta 是另一款以會議為導向的轉錄工具。它的免費方案適合測試介面,但實務限制相當緊:每月 120 分鐘轉錄、每次對話最多 3 分鐘、每月最多 50 個檔案上傳。比較適合用來評估,而非進行真正的長篇工作。
最適合: 在升級前測試會議轉錄介面。
免費方案細節:
- 每月 120 分鐘轉錄
- 每次對話最多 3 分鐘
- 每月 50 個檔案上傳
- 會議整合與講者識別
限制: 3 分鐘的對話上限,對大多數訪談、課程、Podcast 或客戶通話來說都太短。匯出與翻譯也屬於付費工作流程,所以免費方案比較像試用品,無法支撐長期穩定的免費轉錄需求。
6. Google Recorder
如果你的工作流程從 Pixel 手機開始,Google Recorder 表現出色。它在裝置上錄音與轉錄,可以搜尋錄音內容,並支援越來越多的轉錄語言(依裝置與地區而定)。
最適合: Pixel 裝置上的快速手機錄音。
免費方案細節:
- 在支援的 Pixel 手機上免費
- 即時錄音與轉錄
- 可搜尋的錄音
- 透過 Google 生態系的匯出/分享流程
限制: 它不是通用的網頁轉錄工具。你不能直接貼上 Bilibili、YouTube、SoundCloud 或 Drive URL。它也無法直接取代具備字幕匯出、講者標籤、翻譯與批次處理的逐字稿編輯器。
7. Happy Scribe
Happy Scribe 是一款打磨精緻的逐字稿與字幕編輯器,提供 AI、翻譯與人工服務。它的免費方案最好理解為試用:包含 10 分鐘的 AI 轉錄、字幕與翻譯試用。
最適合: 試用專業的逐字稿/字幕編輯器。
免費方案細節:
- 10 分鐘 AI 試用
- 涵蓋 AI 轉錄、字幕與翻譯試用
- 為逐字稿校對與字幕設計的編輯器
限制: 10 分鐘足以測試品質,但不足以支撐長期免費工作流程。如果你有持續的轉錄需求,預期會走到付費方案。
詳細的產品比較請看 Happy Scribe vs Vocova。
依使用情境推薦最佳免費工具
| 使用情境 | 最佳起點 | 為何 |
|---|---|---|
| 短音訊轉文字 | Vocova audio to text | 簡單的網頁上傳、100+ 語言、Free 即可 TXT 匯出 |
| 短影片轉文字 | Vocova video to text | 處理影片檔案,並導入同一個逐字稿編輯器 |
| 線上影片逐字稿 | Vocova link import | 避免「先下載再上傳」的工作流程 |
| Bilibili 逐字稿 | Transcribe Bilibili | 專屬的 Bilibili URL 流程 |
| SoundCloud 逐字稿 | Transcribe SoundCloud | 專為公開 SoundCloud 連結設計 |
| 從逐字稿產生字幕檔 | SRT generator 或 VTT generator | 產出影音平台與剪輯軟體可用的字幕格式 |
| 多語言轉錄 | Vocova audio to text | 100+ 語言自動偵測 |
| 轉錄後翻譯 | Translate audio | 在 Plus / Pro 上將逐字稿翻譯為 140+ 種目標語言 |
| 本機/離線技術工作流程 | Whisper | 不需要代管服務 |
| Pixel 手機語音筆記 | Google Recorder | 從 Pixel 開始錄音時的最快路徑 |
如何不浪費時間選工具
用以下決策規則:
- 如果素材已經在線上,避開只能上傳的工具。 選一個能貼上公開 URL 的流程。
- 如果你需要字幕,動工前先確認 SRT/VTT 匯出。 很多工具能顯示字幕,卻會把字幕匯出鎖在付費牆後。
- 如果你需要翻譯,先確認翻譯是否包含或要付費。 轉錄與翻譯的計價常常是分開的。
- 如果檔案超過 30 分鐘,仔細看實際限制。 免費方案乍看寬鬆,撞到單檔長度、檔案匯入或匯出限制就會卡住。
- 如果隱私是首要考量且你具備技術能力,使用本機模型。 Whisper 是你能自己跑時最有彈性的免費選項。
為何免費轉錄方案讓人困惑
「免費轉錄」可以代表很多種意思:
- 真正具有持續使用量的免費方案。
- 一次性的試用。
- 無限轉錄,但沒有實用的匯出。
- 大量分鐘數,但單檔長度很短。
- 只支援即時會議轉錄,不支援上傳檔案。
- 只能上傳,無法 URL 匯入。
- 包含逐字稿閱讀,但 SRT/VTT/PDF/DOCX 匯出鎖在付費。
所以上面那張表會把分鐘數、檔案限制、URL 匯入、語言支援與匯出分開來看。最重要的問題不是「它免費嗎?」,而是「我能不能在免費方案上完成我真正的任務?」
常見問題
2026 年最佳的免費語音轉文字工具是什麼?
對多數人來說,Vocova 是整體最佳起點,因為它在免費方案上就能處理音訊檔、影片檔、公開 URL 匯入、100+ 轉錄語言與 TXT 匯出。Riverside 在快速產出免費 TXT/SRT 上很有競爭力。如果你想要本機掌控且能搞定技術設定,Whisper 最合適。
影片轉文字免費的最佳工具是哪一款?
挑同時支援影片上傳與線上影片匯入的工具。如果影片已經在 YouTube、Bilibili、SoundCloud、Dailymotion 或雲端硬碟上,URL 匯入流程比下載再上傳快得多。本機檔案從 video to text 開始;公開平台連結用 transcribe Bilibili、transcribe SoundCloud 與 transcribe Dailymotion。
我能免費轉錄非英文的語言嗎?
可以。Vocova 在免費方案上支援 100+ 種語言並具備自動偵測。Riverside 也宣稱其免費轉錄器支援 100+ 語言。如果你自己跑 Whisper,它支援多語言語音辨識。會議型工具的語言支援可能較窄,或方案有特定限制,所以一定要用你實際的語言與口音測試。準確度依語言而異——逐語言的 WER 分級可看 transcription accuracy by language,多語言工作流程則看 how to transcribe audio in multiple languages。
免費的語音轉文字工具能做字幕嗎?
部分可以。Riverside 的免費轉錄器提供 TXT 與 SRT 下載。Whisper 透過本機工具可產出 SRT/VTT。Vocova 在 Free 包含 TXT 匯出,SRT 與 VTT 匯出則在 Plus / Pro 提供。如果字幕是目標,動手編輯逐字稿前先確認 SRT/VTT 匯出。
Bilibili 影片轉文字最好的免費工具是什麼?
用 Transcribe Bilibili。許多通用轉錄工具是圍繞檔案上傳或 YouTube 流程設計的,無法乾淨地處理 Bilibili 連結——遇到 BV... ID、b23.tv 短連結或 m.bilibili 行動版 URL 就會卡住。當你想從公開的 Bilibili 影片得到逐字稿、字幕或英文翻譯,專為 Bilibili 設計的流程更合適。完整步驟(包括如何處理 UP主 名稱、粉絲圈用語與中英夾雜的語言切換),請看 how to transcribe Bilibili videos。
免費的語音轉文字工具夠專業使用嗎?
對草稿、筆記、內容再利用與可搜尋的歸檔來說,準確度通常足夠。要用於出版、法律、醫療、學術或對外交付,預期需要校對。準確度更多取決於音質、說話者重疊、口音與語言,而不是這個方案是不是免費。
免費的語音轉文字工具會留存我的音訊嗎?
各家政策不一。雲端工具會在伺服器上處理檔案,並各自有保存政策。像 Whisper 這類本機工具可以完全在你的機器上跑。如果隱私至關重要,請閱讀各服務的資料政策,敏感檔案請使用本機處理。
資料來源與延伸閱讀
外部來源(競品方案限制,皆於 2026-04-27 驗證):
- Riverside AI transcription
- Otter.ai Basic free plan limits
- Notta pricing
- Google Recorder transcription help
- Happy Scribe plans and pricing
- OpenAI Whisper release
相關 Vocova 指南:
