Bilibili 影片轉文字完整指南:逐字稿、字幕與英文翻譯
一份實用指南,教你不必先下載影片,就能把公開的 Bilibili 影片變成逐字稿、字幕檔,或英文翻譯。
最後驗證日期:2026-05-01。Bilibili 偶爾會調整分享連結格式(BV/AV/b23.tv)與播放器架構;如果某種連結格式忽然失效,請改用下方介紹的標準格式 www.bilibili.com/video/BV...。
在中國本土工具之外處理 Bilibili 影片並不容易。一支影片裡可能有很有價值的講座、動漫評論、遊戲分析、產品開箱或會議演講,但逐字稿不一定能以可搜尋、可引用、可翻譯,或可轉成字幕的格式取得。通用的轉錄工具——通常是為檔案上傳或 YouTube 風格的 URL 設計——往往會拒絕 BV... ID、處理不了 b23.tv 短連結,或被 m.bilibili.com 行動版 URL 卡住。
最快的工作流程其實很簡單:複製公開的 Bilibili URL,貼到一個懂 Bilibili 的轉錄工具裡,產生逐字稿,然後匯出文字、字幕或英文翻譯。只要影片是公開的、不登入也能打開連結,你通常不需要手動下載。
當你想要直接把 Bilibili 變成文字時,使用 Transcribe Bilibili。
快速工作流程
| 步驟 | 該做什麼 | 產出 |
|---|---|---|
| 1 | 複製 Bilibili 影片 URL、BV 連結、行動版連結,或 b23.tv 短連結 | 一條公開的來源 URL |
| 2 | 把 URL 貼進 Transcribe Bilibili | Vocova 會在伺服器端抓取媒體 |
| 3 | 讓口語自動偵測,或手動選擇語言 | 帶時間軸的逐字稿 |
| 4 | 校對名稱、術語與講者標籤 | 更乾淨的逐字稿文字 |
| 5 | 依方案匯出 TXT、PDF、DOCX、SRT、VTT 或 CSV | 文字、文件或字幕檔 |
| 6 | 需要時翻譯成英文 | 英文逐字稿或雙語輸出 |
什麼算是 Bilibili 逐字稿?
Bilibili 逐字稿可以代表三件不同的事:
- 純文字逐字稿: 把口語轉成文字。
- 字幕檔: SRT 或 VTT 格式的帶時間字幕。
- 翻譯後的逐字稿: 把原始逐字稿翻成另一種語言,通常是中翻英。
不同產出對應不同任務。學生想要可搜尋的筆記。研究者需要時間軸來引用。創作者需要字幕來做在地化影片。譯者需要中英並列的對照文字。
Vocova 從同一個轉錄步驟出發,再讓你選擇對應任務的輸出格式。
步驟 1:複製 Bilibili 影片 URL
盡量使用一般的瀏覽器網址:
https://www.bilibili.com/video/BV1xx411c7XW
行動版 URL 與短連結,只要能解析到公開影片,也都可以:
https://m.bilibili.com/video/BV...
https://b23.tv/...
關鍵測試是:這條連結能否在無痕視窗、不登入帳號的情況下打開?如果它需要登入、會員權限、年齡驗證、私人工作區或地區授權,伺服器端的轉錄工具就無法以你的身份抓取。
步驟 2:把連結貼進 Bilibili 轉錄工具
打開 Transcribe Bilibili,貼上 URL,並開始轉錄。這樣可以避免常見的手動流程:
- 找一個 Bilibili 下載器。
- 把影片存到本機。
- 抽出音訊。
- 把音訊上傳到一個轉錄 App。
- 等第二次上傳。
這條繞路很慢、又很容易壞掉。「貼一條連結」的工作流程更乾淨,因為媒體是直接從公開 URL 抓取的。
如果你已經下載好檔案,或從別人那邊拿到了,請改用 video to text。
步驟 3:選擇語言設定
對多數 Bilibili 影片來說,自動語言偵測就夠用。Vocova 支援 100 種以上的口語,能在產生逐字稿前先偵測語言。
以下情況建議手動選擇語言:
- 影片有強烈的地區口音。
- 第一分鐘是配樂、片頭動畫,或非語音的聲響。
- 影片在普通話、廣東話、英文、日文、韓文或其他語言之間切換。
- 你已知道目標語言,並想降低偵測上的模糊空間。
對於中英夾雜的影片,請保持務實的期待。AI 轉錄處理常見的語言切換(code-switching)已比舊工具好,但語言頻繁切換時,仍可能需要手動校對。
步驟 4:清理逐字稿
Bilibili 內容有一個明顯的型態:大段乾淨的普通話之間,會夾著模型很少看過的專有名詞——UP主(創作者)名稱、動漫與漫畫標題、遊戲 ID、粉絲圈用語(CP、二創、鬼畜、彈幕相關用語)、被夾進英文的科技術語(Transformer、pipeline、latency),以及中英混合的產品名(例如 小米 14 Ultra、iPad Pro M4)。自動轉錄處理口語普通話表現不錯,但這些專有名詞經常會被搞錯,這正是花時間校對最划算的地方。
請依下列順序進行清理:
- 先修 UP主與來賓名稱。 受過普通話訓練的模型常挑出聽起來像、但其實是錯的字(例如 小红 vs 晓宏,繁體版本可能是 小紅 vs 曉宏)。把每個名字一次找出來取代,後面的逐字稿就會跟著對齊。
- 統一遊戲、動漫、音樂與產品名稱。 決定要用原名(
原神)還是羅馬拼音/英文(Genshin Impact),然後一致套用——這對之後的翻譯很重要。 - 修正中英夾雜術語。 科技、遊戲與學術類 Bilibili 影片常常在句中切換英文(例如「我們今天講 attention mechanism」)。模型通常能正確聽出英文片段,但音訊不清晰時可能會被音譯成拼音。
- 抓出彈幕相關內容。 講者常會回應即時留言(「看彈幕說……」、「前方高能」)。決定是要保留作為氛圍,還是刪掉以求乾淨的逐字稿。
- 把長段落切成可讀的段落。 Bilibili 的單口論述常常很長;依主題切段,匯出當筆記更好用。
- 移除重複的開頭/結尾話術(「一鍵三連」、「記得點讚投幣收藏關注」),如果你做的是筆記而非字幕。
- 保留時間軸,如果你需要引用或字幕。
如果音訊有雜訊,可參考 how to get accurate transcriptions from noisy audio 中的清理原則。針對普通話、廣東話、日文與英文的逐語言準確度預期,請看 transcription accuracy by language。
步驟 5:選對匯出格式
依逐字稿之後要去哪裡來決定匯出格式。
| 需求 | 最佳匯出 | 為什麼 |
|---|---|---|
| 可搜尋的筆記 | TXT | 輕量、好複製 |
| 文件審閱 | DOCX 或 PDF | 更適合分享與留言 |
| 影片字幕 | SRT | 與影片剪輯軟體與平台相容性最好 |
| 網頁字幕 | VTT | 更適合 HTML5 影片與網頁播放器 |
| 資料分析 | CSV | 需要表格化的時間軸、講者或片段時很實用 |
| 翻譯校對 | 雙語 PDF 或 DOCX | 來源與翻譯並排對照 |
如果目標是字幕,可看 SRT generator、VTT generator,以及更全面的 subtitle file formats guide。
如何把 Bilibili 影片翻成英文
最乾淨的翻譯流程是:
- 用原始口語把 Bilibili 影片轉錄出來。
- 校對原始逐字稿,至少把名稱與關鍵術語修對。
- 把逐字稿翻譯成英文。
- 匯出英文逐字稿,或匯出原文+英文的雙語輸出。
- 如果需要字幕,匯出翻譯後的 SRT 或 VTT。
當影片有專有名詞、俚語、粉絲圈詞彙或技術內容時,不要跳過原文逐字稿的校對。翻譯品質取決於來源逐字稿品質。中文裡寫錯的名字,幾乎永遠會在英文裡也錯——而且 Bilibili 內容會產生的這類錯誤,在翻譯後特別難被抓到,因為:
- 專有名詞與俚語會被攤平成普通的英文。 中文裡寫錯的 UP主 名字,會變成讀起來流暢、但完全沒指到任何人的英文「翻譯」。
- 動漫與遊戲名稱會偏離官方英文版。
咒術迴戰應該翻成Jujutsu Kaisen,而不是逐字回譯。如果來源逐字稿把標題猜錯,英文輸出就會更偏離真正的作品。 - 科技術語會被「過度翻譯」。 講者常常切換到英文(
embedding、latency),而過度熱心的譯者可能會把這些英文再翻回中式英文(embedded thing)。請在來源逐字稿裡保留切換進來的英文就是英文。 - 編號式指稱會失去意義。
B 站(= bilibili.com)逐字翻會變成 "B-station";要視你的讀者來決定保留原來的縮寫、平台名,還是兩者都放。
當最終交付物是英文逐字稿或英文字幕檔時,使用 translate video。如果就是中翻英,先擷取來源音訊,再用 translate audio 並選擇 English 作為目標語言;廣東話的 Bilibili 內容(香港/廣東創作者)則在來源步驟使用 transcribe Cantonese。
Bilibili 逐字稿的使用情境
學生與語言學習者
逐字稿讓 Bilibili 講座或教學變得可搜尋。你可以複製範例、整理單字表,或翻譯困難段落,而不需要反覆重播同一段。
對語言學習而言,雙語輸出特別有用:原文中文一邊、英文另一邊。並排工作流程可看 bilingual subtitles。
研究者與記者
當 Bilibili 影片本身就是證據或第一手材料時,時間軸非常重要。請在逐字稿中保留時間軸,讓每一句引文都能追回原片。對研究筆記來說,DOCX 或 CSV 通常比純文字好用。
創作者與在地化團隊
創作者常常需要字幕,而非純逐字稿。先產生逐字稿、必要時翻譯,再匯出 SRT 或 VTT。這樣可以讓字幕時間軸與原始口語綁在一起。
行銷與社群團隊
長 Bilibili 影片常含有可重複利用的片段、金句、產品說明,以及觀眾的語言。逐字稿讓你更容易抓出開場 hook、整理重點,並把短片在地化到其他平台。
疑難排解
Bilibili 連結無法使用
確認連結能否在無痕視窗中打開。打不開的話,轉錄工具就無法抓取。試著用標準的 www.bilibili.com/video/BV... URL 取代分享用的封裝連結。
逐字稿開頭辨識成錯誤的語言
開始前手動選擇語言。當影片以配樂、音效或英文標題卡開頭,但主體是中文時,這個動作特別有幫助。
逐字稿漏掉名稱或專業術語
在翻譯或匯出字幕前,先把逐字稿修對。專有名詞是性價比最高的清理任務。
字幕每行太長
調整 SRT 或 VTT 匯出設定,讓行寬切得更積極。字幕可讀性靠的是行長,而不只是時間。
影片本身已有 Bilibili 字幕
既有字幕有時候有用,但不一定能下載、不一定完整、也不一定有翻譯。當你需要可編輯文字、雙語輸出,或自己的字幕檔時,重新產生一份逐字稿會更好。
Bilibili 影片太長或太大,匯入失敗
URL 匯入是在伺服器端執行的,意思是來源媒體必須符合伺服器端的抓取預算——目前 URL 匯入大約是 200 MB。一場長講座或多小時的直播回放,即使位元率不高也會超標。如果長影片匯入失敗,最乾淨的做法是:
- 在你有權限且平台允許的前提下,自己下載影片檔案。
- 打開 video to text 並直接上傳檔案。Plus / Pro 支援最大 5 GB 的上傳。
- 逐字稿編輯器、語言設定、匯出格式與翻譯流程,都與 URL 匯入完全相同。
對於長期的 Bilibili 長片工作(例如一整套課程、多集講座系列),上傳原始檔案通常比反覆重貼 URL 更快、也更穩定。
常見問題
不下載也能轉錄 Bilibili 影片嗎?
可以,前提是影片公開。把 Bilibili URL 貼到 Transcribe Bilibili,Vocova 會在伺服器端抓取媒體。如果影片是私人或需要登入,請在你有權限的情況下自行下載檔案,再用 video to text。
我可以把 Bilibili 影片翻成英文嗎?
可以。先產生原文逐字稿,再翻成英文。為了取得最佳效果,翻譯前先快速校對原文逐字稿,把名稱、遊戲標題、創作者名與技術術語修對。
我能把 Bilibili 字幕匯出成 SRT 或 VTT 嗎?
可以。轉錄完成後,可以匯出 SRT 以取得最佳相容性,或匯出 VTT 給網頁影片工作流程使用。SRT 與 VTT 匯出在 Plus / Pro 提供。
這個流程支援 b23.tv 短連結嗎?
可以,只要短連結最終解析到的是公開的 Bilibili 影片。如果短連結失敗,先在瀏覽器打開它,再複製最終的 bilibili.com/video/BV... URL。
如果 Bilibili 影片中英夾雜怎麼辦?
自動轉錄能處理許多中英夾雜段落,但 code-switching 比單一語言難。建議手動指定主要口語,再對混合語言的段落進行校對,最後再翻譯或匯出字幕。
Bilibili 逐字稿能合法使用嗎?
只轉錄、再利用你有權處理的影片。逐字稿可用於個人學習、無障礙、研究或經授權的在地化,但重新發布他人的內容可能需要取得授權。
簡短版本
如果你需要 Bilibili 逐字稿,請避開「下載再上傳」的繞路。把公開的 Bilibili URL 貼進 Transcribe Bilibili,產生帶時間軸的逐字稿,校對 UP主 名字與其他專有名詞,再依工作流程匯出 TXT、DOCX、PDF、SRT、VTT、CSV,或英文翻譯。如果是超出 URL 匯入大小預算的長講座或直播回放,請自行下載檔案後改用 video to text。
相關指南
- Best free transcription tools in 2026——比較 Vocova、Riverside、Whisper、Otter、Notta、Google Recorder 與 Happy Scribe 的免費方案限制。
- How to transcribe online videos and podcasts by pasting a link——更廣的 URL 匯入工作流程,涵蓋 YouTube、SoundCloud、Dailymotion、Podcast 與雲端硬碟。
- How to transcribe audio in multiple languages——code-switching、雙語校對與翻譯匯出的工作流程。
- Transcription accuracy by language——普通話、廣東話、日文與英文的 WER 分級預期。
