隱藏式字幕 vs 字幕:有什麼差別?
了解隱藏式字幕和字幕之間的關鍵差異。學習何時使用哪種、無障礙要求,以及它們是如何被建立的。
隱藏式字幕(closed captions)包含聲音描述,為聽障觀眾而設計;而字幕(subtitles)則假設觀眾聽得到,只轉錄對話內容。儘管在日常對話中經常被混用,這兩種格式服務不同的受眾、遵循不同的標準,且包含不同類型的資訊。
無論你是內容創作者、教育工作者還是希望讓影片具備無障礙性的企業,了解這個區別都很重要。選錯格式可能會讓觀眾缺乏關鍵脈絡,或讓你違反無障礙法規。本指南詳細拆解隱藏式字幕和字幕的差異、何時使用各種格式,以及現代 AI 工具如何讓製作這兩者變得比以前簡單得多。
什麼是隱藏式字幕?
隱藏式字幕是一種文字覆蓋層,代表影片中每一個有意義的聲音,不僅僅是口語。它們最初是在 1970 年代為電視開發的,讓聽障觀眾能完整接收播出內容。
隱藏式字幕軌道通常包含:
- 對話 附帶講者辨識(例如「旁白:」或「SARAH:」)
- 音效 以方括號描述,例如 [門砰地關上]、[電話響]或 [腳步聲漸近]
- 音樂描述 例如 [輕快的爵士樂] 或 [悲傷的鋼琴旋律]
- 語氣和方式指示 例如 [低語]、[諷刺地] 或 [大喊]
- 具有意義的非語音音訊提示 例如 [沉默]、[掌聲] 或 [靜電聲]
「隱藏式」這個詞表示字幕可以由觀眾自行開啟或關閉。這與開放式字幕(open captions)不同,後者是永久嵌入影片畫面中的。大多數串流平台、電視播出和影片播放器都通過 CC 按鈕或無障礙選單支援隱藏式字幕。
隱藏式字幕與音訊時間軸同步,具有精確的時間戳記。每個字幕區塊在特定時刻出現和消失,確保文字與螢幕上正在發生的事情相符。隱藏式字幕的標準檔案格式包括 SRT 和 VTT,以及 SCC 和 MCC 等廣播專用格式。
什麼是字幕?
字幕是影片中口語對話的文字呈現。它們為能聽到音訊但需要將語音轉換為文字的觀眾而設計,最常見的原因是影片使用的是外語。
字幕通常包含:
- 口語對話 逐字轉錄或翻譯
- 螢幕文字翻譯 當影片中出現標誌、標題或書面內容時
- 講者標示 在某些情況下,但比字幕中的不夠一致
字幕通常不包含定義隱藏式字幕的非語音音訊資訊。字幕軌道不會告訴你螢幕外有一扇門被砰地關上、懸疑的音樂正在加強,或一個角色在低語。假設是觀眾能聽到這些元素。
字幕最常與外語內容相關聯。當你觀看一部法語電影且螢幕上有英文文字時,你正在閱讀字幕。文字已被翻譯並同步到原始對話,但不會描述環境聲音或音樂配樂。
字幕使用與隱藏式字幕相同的檔案格式,主要是 SRT 和 VTT,這有時會模糊兩者之間的界線。差異在於內容,而非容器。
隱藏式字幕和字幕的關鍵差異
| 特徵 | 隱藏式字幕 | 字幕 |
|---|---|---|
| 主要受眾 | 聽障觀眾 | 觀看外語內容的聽力正常觀眾 |
| 對話 | 是 | 是 |
| 音效 | 是,以方括號描述 | 否 |
| 音樂描述 | 是 | 否 |
| 講者辨識 | 是,通常有標記 | 有時 |
| 語言 | 通常與音訊相同語言 | 通常是不同語言(翻譯) |
| 可切換 | 是,觀眾可開啟/關閉 | 是 |
| 法律要求 | 通常是(ADA、FCC、EU) | 通常不是 |
核心區別在於完整性。隱藏式字幕旨在以文字形式呈現整個音訊軌道。字幕旨在讓口語對話以另一種語言或文字形式可讀。
實際上,術語因地區而異。在美國,「closed captions」和「subtitles」是上述所描述的不同概念。在英國和歐洲大部分地區,「subtitles」涵蓋了兩種用途,美國人所說的 closed captions 通常被稱為「為聽障人士設計的字幕」(SDH)。如果你在國際間發布內容,明確說明你的文字軌道包含什麼內容比僅依賴術語更有幫助。
開放式字幕 vs 隱藏式字幕
除了字幕和隱藏式字幕之間的區別外,開放式和隱藏式字幕之間還有一個重要的差異。
隱藏式字幕 以獨立的資料軌道與影片一起傳送。觀眾可以切換開關、調整大小,有時還能改變外觀。串流服務、DVD 和電視播出都使用隱藏式字幕。
開放式字幕(也稱為燒錄字幕或硬編碼字幕)永久渲染到影片影像本身中。它們無法關閉、調整大小或重新定位。一旦影片以開放式字幕匯出,每位觀眾都會看到它們。
何時適合使用開放式字幕
- 社群媒體影片 在無聲自動播放時,觀眾可能不知道如何在平台上啟用字幕
- 短影片內容 在 Instagram 限時動態或 TikTok 等平台上,字幕切換不一定可用
- 簡報和資訊站展示 觀眾無法與播放控制互動時
- 確保可見性 當你需要保證每位觀眾都看到文字時
何時隱藏式字幕更好
- 長影片內容 觀眾偏好很重要時
- 無障礙合規 因為法規通常要求觀眾控制字幕顯示
- 多語言發布 需要提供多種語言的字幕軌道時
- 平台要求 因為 YouTube、Vimeo 和大多數串流服務期望隱藏式字幕檔案
大多數專業工作流程會產出隱藏式字幕檔案(SRT 或 VTT),因為它們提供最大的靈活性。你之後隨時可以將它們燒錄進去,但一旦渲染就無法從影片中提取開放式字幕。
字幕的法律要求
多個司法管轄區的無障礙法規要求特定類型的影片內容提供隱藏式字幕。以下是主要法規的簡要概述。
美國
- 美國身心障礙者法案(ADA):法院將 ADA 解釋為要求符合公共場所條件的企業為影片內容提供字幕。這越來越包括網站和線上影片。
- 第 508 條:聯邦機構必須使電子內容具備無障礙性,包括帶字幕的影片。
- FCC 法規:電視廣播業者和先前已在電視播出內容的線上發布者必須提供隱藏式字幕。
- CVAA(21 世紀通訊和影片無障礙法案):將字幕要求延伸到最初在電視上播出的網路傳輸影片。
歐盟
- 歐洲無障礙法案(EAA):於 2025 年生效,要求數位服務(包括影片平台)符合無障礙標準。字幕是關鍵組成部分。
- EN 301 549:歐洲 ICT 無障礙標準,參考 WCAG 並包含字幕和音訊描述的要求。
網頁標準
- WCAG 2.1 Level AA:網頁內容無障礙指南要求同步媒體中所有預錄音訊內容必須有字幕(成功準則 1.2.2),以及即時音訊內容的字幕(Level AA 的成功準則 1.2.4)。
不提供字幕不僅限制了你的受眾。它還使組織面臨法律風險,特別是在美國,與 ADA 相關的數位無障礙訴訟近年來顯著增加。
何時使用隱藏式字幕 vs 字幕
選擇字幕還是隱藏式字幕取決於你的受眾和發布情境。
使用隱藏式字幕當:
- 你的受眾包含聽障觀眾
- 你在支援可切換文字軌道的平台上發布
- 需要或期望符合無障礙合規
- 你的內容具有有意義的非語音音訊(音效、音樂、環境音)
- 字幕與音訊使用相同語言
使用字幕當:
- 你為外語受眾翻譯內容
- 音訊清晰可聽且觀眾只需要對話文字
- 你向國際市場發布並需要多語言文字軌道
兩者都使用當:
- 你想要最大觸及率,提供同語言字幕用於無障礙性和翻譯字幕用於國際觀眾
- 你的平台支援多個文字軌道(YouTube、Vimeo、大多數串流服務)
在許多情況下,實際的答案是先製作原始語言的完整隱藏式字幕檔案,然後從中建立翻譯字幕軌道。這讓你同時獲得無障礙覆蓋和國際觸及。
如何用 AI 建立字幕和隱藏式字幕
製作字幕和隱藏式字幕過去意味著數小時的手動轉錄工作或昂貴的專業服務。AI 語音轉錄工具已經大幅改變了這個等式。一段人工轉錄員需要四到六小時才能製作字幕的錄音,現在可以在幾分鐘內處理。
以下是使用 AI 建立字幕或隱藏式字幕的典型工作流程:
步驟 1:轉錄音檔
將你的音檔或影片檔案上傳到 Vocova 等 AI 語音轉錄工具。工具使用自動語音辨識將語音轉換為帶有時間戳記的文字,如果支援的話還包含講者標記。準確度取決於音檔品質,因此從乾淨的錄音開始會有幫助。如果你的音檔有背景噪音,有改善結果的技巧。
步驟 2:審閱和編輯
AI 語音轉錄並不完美。業界使用字錯誤率(WER)來衡量準確度,即使是最好的模型也會產生一些錯誤,特別是在專有名詞、技術術語或帶口音的語音上。審閱逐字稿並修正任何錯誤。
步驟 3:添加非語音元素(用於隱藏式字幕)
如果你要製作隱藏式字幕而非字幕,你需要添加 AI 可能未擷取到的音效描述、音樂提示和講者標記。部分工具提供講者分離來幫助辨識,但音效描述通常需要手動標註。
步驟 4:匯出正確的格式
將完成的逐字稿匯出為 SRT 或 VTT 檔案。這是跨影片平台最廣泛支援的兩種字幕格式。大多數 AI 字幕產生器可以匯出這兩種格式。Vocova 支援匯出為 SRT、VTT 和其他多種格式,包括 PDF、DOCX 和 CSV。
步驟 5:翻譯用於字幕
如果你需要額外語言的字幕,使用翻譯功能生成逐字稿的翻譯版本。Vocova 支援翻譯至 145+ 語言,使建立多語言字幕軌道變得簡單直接。審閱翻譯字幕的準確度,特別注意慣用語表達和文化脈絡。
步驟 6:上傳到你的平台
將你的 SRT 或 VTT 檔案添加到你的影片平台。YouTube、Vimeo 和大多數託管服務允許你上傳多個字幕軌道,讓觀眾選擇他們偏好的語言和格式。
常見問題
隱藏式字幕和字幕是一樣的嗎?
不是。隱藏式字幕包含音效、音樂和講者辨識等非語音音訊描述。字幕只包含對話文字,主要用於語言翻譯。在某些地區術語有重疊,但內容是不同的。
YouTube 需要隱藏式字幕還是字幕?
YouTube 兩者都支援。如果你想觸及最廣泛的受眾,上傳同語言字幕用於無障礙性,以及翻譯字幕用於國際觀眾。YouTube 也會自動生成字幕,但其準確度參差不齊,且不包含非語音音訊描述。
字幕應該使用什麼檔案格式?
SRT 和 VTT 是最廣泛支援的格式。SRT 幾乎在每個影片平台和編輯器上都能使用。VTT 提供額外的樣式選項,是 HTML5 網頁影片的標準。詳細比較請參閱我們的 SRT vs VTT 格式指南。
字幕是法律要求的嗎?
在許多情況下是的。ADA、第 508 條、WCAG 2.1 和歐洲無障礙法案都包含針對特定類型內容和組織的字幕要求。即使在法律沒有強制要求的地方,字幕也能提升無障礙性、互動率和 SEO。
AI 可以自動生成隱藏式字幕嗎?
AI 可以生成帶有時間戳記和講者標記的準確轉錄,這構成了隱藏式字幕檔案的基礎。然而,[正在播放音樂] 或 [門砰地關上] 等非語音音訊描述通常需要手動添加,因為大多數 ASR 模型專注於語音辨識而非一般音訊事件偵測。
SDH 和隱藏式字幕有什麼差別?
SDH 代表「為聽障人士設計的字幕」(subtitles for the deaf and hard of hearing)。它結合了字幕和隱藏式字幕兩者的元素:它像隱藏式字幕一樣包含非語音音訊描述,但以字幕軌道的形式格式化和傳送。SDH 在 DVD、藍光和串流平台上很常見,在「subtitles」是所有文字軌道預設術語的地區,它通常是標準格式。