SRT vs VTT: Untertitelformate im Vergleich und Leitfaden
SRT vs VTT verglichen: Lernen Sie die Unterschiede zwischen SubRip- und WebVTT-Untertitelformaten kennen, welche Plattformen welches unterstützen und wann welches Format zu verwenden ist.
SRT (SubRip Text) und VTT (WebVTT) sind die beiden am häufigsten verwendeten Untertitel-Dateiformate: SRT ist der bewährte Standard mit nahezu universeller Videoplayer-Unterstützung, während VTT das moderne, web-native Format ist, das speziell für HTML5-Video mit integrierten Styling- und Positionierungsfähigkeiten entwickelt wurde.
Die Wahl des richtigen Untertitelformats beeinflusst Kompatibilität, Styling-Optionen und wie Ihre Untertitel auf verschiedenen Plattformen dargestellt werden. Dieser Leitfaden erklärt genau, wie sich SRT und VTT unterscheiden, welche Plattformen welches Format unterstützen und wann Sie sich für eines entscheiden sollten.
Was ist SRT?
SRT steht für SubRip Text, ein Untertitelformat, das in den späten 1990er Jahren als Teil der SubRip-Software entstanden ist – einem Tool zum Extrahieren („Rippen") von Untertiteln aus DVDs. Trotz seines Alters bleibt SRT das universell am breitesten unterstützte Untertitelformat der Branche.
Eine SRT-Datei ist eine Klartextdatei mit der Endung .srt. Jeder Untertiteleintrag besteht aus drei Teilen: einer fortlaufenden numerischen Kennzeichnung, einer Timecode-Zeile mit Start- und Endzeiten sowie einer oder mehreren Zeilen Untertiteltext. Einträge werden durch Leerzeilen getrennt.
So sieht die Struktur einer SRT-Datei aus:
1
00:00:01,000 --> 00:00:04,000
Dies ist die erste Untertitelzeile.
2
00:00:05,500 --> 00:00:08,200
Dies ist der zweite Untertitel.
Er kann mehrere Zeilen umfassen.
3
00:00:10,000 --> 00:00:13,750
Sprecheridentifikation wird
manuell im Text selbst vorgenommen.
Hauptmerkmale des SRT-Formats:
- Timecode-Format:
HH:MM:SS,mmm(Stunden, Minuten, Sekunden, Millisekunden getrennt durch ein Komma) - Fortlaufende Nummerierung: Jeder Cue wird ab 1 nummeriert
- Nur Klartext: Keine native Unterstützung für Styling, Farben oder Positionierung
- Kodierung: Typischerweise UTF-8, obwohl ältere Dateien andere Kodierungen verwenden können
- Pfeil-Trenner: Start- und Endzeiten werden durch
-->getrennt
Die Einfachheit von SRT ist sowohl seine größte Stärke als auch seine Haupteinschränkung. Jeder Texteditor kann SRT-Dateien erstellen und ändern, und praktisch jeder Videoplayer und jede Bearbeitungsanwendung kann sie lesen. Allerdings können Sie innerhalb der Formatspezifikation selbst keine Schriftgröße, Farbe, Platzierung oder andere visuelle Eigenschaft steuern.
Was ist VTT?
VTT steht für WebVTT (Web Video Text Tracks), ein Untertitel- und Caption-Format, das vom W3C (World Wide Web Consortium) speziell für die Verwendung mit den HTML5-Elementen <video> und <track> entwickelt wurde. Die Spezifikation wurde erstmals 2010 veröffentlicht und wurde zu einer W3C-Empfehlung, was es zum offiziellen Standard für webbasierte Video-Untertitel macht.
Eine VTT-Datei ist eine Klartextdatei mit der Endung .vtt. Sie muss mit dem Header WEBVTT beginnen, optional gefolgt von Metadaten. Jeder Cue kann eine optionale Kennung, eine Timecode-Zeile und den Untertiteltext enthalten.
So sieht die Struktur einer VTT-Datei aus:
WEBVTT
Kind: captions
Language: de
intro
00:00:01.000 --> 00:00:04.000
Dies ist die erste Untertitelzeile.
00:00:05.500 --> 00:00:08.200
Dies ist der zweite Untertitel.
Er kann mehrere Zeilen umfassen.
styled-cue
00:00:10.000 --> 00:00:13.750 position:10% align:start
<v Sprecher 1>Dieser Cue hat Positionierung
und ein Voice-Tag für Sprecheridentifikation.</v>
Hauptmerkmale des VTT-Formats:
- Pflicht-Header: Jede Datei muss mit
WEBVTTbeginnen - Timecode-Format:
HH:MM:SS.mmm(verwendet einen Punkt für Millisekunden, kein Komma) - Optionale Cue-Kennungen: Cues können benannte IDs statt fortlaufender Nummern haben
- CSS-Styling-Unterstützung: Unterstützt
::cue-Pseudo-Element für Styling über CSS - Positionierung: Cue-Einstellungen ermöglichen vertikale, Zeilen-, Positions-, Größen- und Ausrichtungskontrolle
- Voice-Tags:
<v Sprechername>-Tags ermöglichen Sprecheridentifikation innerhalb des Formats - Metadaten-Header: Schlüssel-Wert-Paare nach dem
WEBVTT-Header für zusätzlichen Kontext - Kommentare: Unterstützt
NOTE-Blöcke für Anmerkungen auf Dateiebene
VTT wurde entwickelt, um die Einschränkungen älterer Untertitelformate zu adressieren und sich nativ mit Web-Technologien zu integrieren. Seine Unterstützung für CSS-Styling, Sprecher-Voice-Tags und Cue-Positionierung macht es deutlich ausdrucksstärker als SRT für webbasierte Videoplayer.
SRT vs VTT: Hauptunterschiede
Obwohl SRT und VTT auf den ersten Blick ähnlich aussehen, unterscheiden sie sich in mehreren wichtigen Punkten über die Dateiendung hinaus.
| Merkmal | SRT | VTT |
|---|---|---|
| Dateiendung | .srt |
.vtt |
| Datei-Header | Keiner erforderlich | WEBVTT erforderlich |
| Timecode-Trenner | Komma (,) |
Punkt (.) |
| Cue-Nummerierung | Fortlaufende Nummern erforderlich | Optionale benannte Kennungen |
| Text-Styling | Nicht unterstützt | CSS ::cue-Styling, Fett, Kursiv, Unterstrichen |
| Positionierung | Nicht unterstützt | Zeile, Position, Größe, Ausrichtungseinstellungen |
| Sprecheridentifikation | Manuell (textbasiert) | Native Voice-Tags (<v>) |
| Kommentare | Nicht unterstützt | NOTE-Blöcke unterstützt |
| Metadaten | Nicht unterstützt | Header-Metadaten als Schlüssel-Wert-Paare |
| HTML-Tags | Begrenzt (einige Player unterstützen <b>, <i>) |
Volle Unterstützung (<b>, <i>, <u>, <c>, <v>, <lang>) |
| Zeichenkodierung | Variiert (UTF-8 empfohlen) | UTF-8 erforderlich |
| Web-Standard | Nein | W3C-Empfehlung |
Der wichtigste praktische Unterschied für die meisten Benutzer ist Kompatibilität versus Funktionsumfang. SRT funktioniert überall, bietet aber nichts über die Anzeige von zeitgesteuerten Text hinaus. VTT funktioniert nativ im Web mit umfangreichen Formatierungsoptionen, hat aber engere Unterstützung in Desktop-Video-Editoren und älteren Media-Playern.
Plattformkompatibilität
Zu wissen, welche Plattformen welches Format akzeptieren, spart Zeit und vermeidet Konvertierungskopfschmerzen. Hier eine Aufschlüsselung der Unterstützung auf wichtigen Plattformen und Tools.
| Plattform / Tool | SRT | VTT | Anmerkungen |
|---|---|---|---|
| YouTube | Ja | Ja | Akzeptiert beide für manuellen Upload; generiert automatisch SRT |
| Vimeo | Ja | Ja | Akzeptiert beide; empfiehlt VTT für Styling |
HTML5 <video> |
Nein | Ja | VTT ist das einzige nativ unterstützte Format |
| VLC Media Player | Ja | Ja | Volle Unterstützung für beide Formate |
| Adobe Premiere Pro | Ja | Nein | SRT Import/Export; keine native VTT-Unterstützung |
| DaVinci Resolve | Ja | Nein | SRT bevorzugt für Import |
| Final Cut Pro | Ja | Nein | SRT und iTT unterstützt |
| Facebook / Instagram | Ja | Ja | SRT bevorzugt für Upload |
| TikTok | Ja | Nein | SRT für Closed-Caption-Upload |
| Netflix | Beide (via TTML) | Beide (via TTML) | Bevorzugt TTML/DFXP für Auslieferung |
| Zoom | Ja | Ja | VTT für Cloud-Aufnahmen |
| Microsoft Teams | Ja | Ja | VTT generiert für Meeting-Transkripte |
| WordPress | Nein | Ja | HTML5-Video verwendet VTT nativ |
| Wistia | Ja | Ja | Akzeptiert beide für Caption-Upload |
Das allgemeine Muster: Web-Plattformen und moderne Tools unterstützen VTT, während Videobearbeitungssoftware und ältere Player SRT bevorzugen. Wenn Sie Inhalte für die Web-Wiedergabe produzieren, ist VTT die natürliche Wahl. Wenn Sie Dateien an Editoren liefern oder auf Social Media hochladen, ist SRT die sicherere Wahl.
Wann SRT verwenden
Wählen Sie SRT, wenn breite Kompatibilität wichtiger ist als Formatierungskontrolle.
Videobearbeitungs-Workflows. Die meiste professionelle Bearbeitungssoftware – Premiere Pro, DaVinci Resolve, Final Cut Pro, Avid Media Composer – verarbeitet SRT nativ. Wenn Ihre Untertiteldateien zwischen Editoren hin und her bewegt werden müssen, vermeidet SRT Konvertierungsprobleme.
Social-Media-Uploads. Plattformen wie TikTok und Instagram akzeptieren SRT für eingebrannte oder geschlossene Untertitel. Beim Hochladen von Untertiteln auf soziale Plattformen ist SRT oft das einzige akzeptierte Format.
Unterstützung älterer Systeme. Ältere Mediaplayer, Set-Top-Boxen und DVD/Blu-ray-Authoring-Tools wurden rund um SRT gebaut. Wenn Ihr Publikum ältere Wiedergabe-Hardware oder -Software verwendet, garantiert SRT Kompatibilität.
Einfachheit und Portabilität. SRT-Dateien sind trivial einfach zu erstellen, zu bearbeiten und zu debuggen. Es gibt keinen Header zu merken, keine spezielle Syntax, und das Format ist selbsterklärend, selbst für jemanden, der es zum ersten Mal sieht.
Freiberufler- und Kundenlieferung. Bei der Lieferung von Untertiteldateien an Kunden oder Mitarbeiter ist SRT die sicherste Standardwahl, da es keine Erklärung erfordert und mit jedem Tool funktioniert, das der Empfänger verwendet.
Wann VTT verwenden
Wählen Sie VTT, wenn Sie web-native Funktionen, Styling oder Barrierefreiheitskonformität benötigen.
HTML5-Web-Video. Wenn Sie Video auf einer Website mit dem <video>-Element einbetten, ist VTT das einzige Untertitelformat, das vom <track>-Tag unterstützt wird. Keine Konvertierungsebene oder JavaScript-Bibliothek ist nötig.
Gestylte Untertitel. VTT ermöglicht CSS-Styling von Untertiteln über das ::cue-Pseudo-Element. Sie können Schriftart, Farbe, Hintergrund, Deckkraft und Textschatten steuern – alles über Standard-CSS.
video::cue {
background-color: rgba(0, 0, 0, 0.7);
color: #ffffff;
font-size: 1.2em;
}
Untertitel-Positionierung. VTT unterstützt Cue-Einstellungen für präzise Platzierung. Dies ist nützlich, um Bildschirmgrafiken, Sprechernamen oder Lower-Third-Overlays zu vermeiden.
00:00:10.000 --> 00:00:14.000 position:10% line:0 align:start
Dieser Untertitel erscheint oben links.
Sprecheridentifikation. VTTs Voice-Tags (<v>) bieten eine strukturierte Möglichkeit, Sprecher zu identifizieren, was für Meeting-Transkripte, Interviews und Inhalte mit mehreren Sprechern nützlich ist. Player können diese Tags verwenden, um verschiedene Sprecher mit unterschiedlichen Farben zu stylen.
Barrierefreiheitskonformität. Für die WCAG 2.1-Konformität bei Web-Inhalten ist VTT das empfohlene Format, da es sich mit HTML5-Barrierefreiheits-APIs integriert und sowohl Untertitel (für gehörlose/schwerhörige Zuschauer) als auch Beschreibungen (für blinde/sehbehinderte Zuschauer) unterstützt.
Wie man zwischen SRT und VTT konvertiert
Die Konvertierung zwischen SRT und VTT ist unkompliziert, da die Formate strukturell ähnlich sind.
SRT-zu-VTT-Konvertierung
Um eine SRT-Datei manuell in VTT zu konvertieren:
- Fügen Sie
WEBVTTals erste Zeile der Datei hinzu - Fügen Sie eine Leerzeile nach dem Header hinzu
- Ersetzen Sie alle Kommas in Timecodes durch Punkte (
00:00:01,000wird zu00:00:01.000) - Entfernen Sie optional die fortlaufenden Cue-Nummern (sie sind in VTT nicht erforderlich)
- Speichern Sie die Datei mit der Endung
.vtt
Vorher (SRT):
1
00:00:01,000 --> 00:00:04,000
Willkommen zur Präsentation.
2
00:00:05,500 --> 00:00:08,200
Heute behandeln wir drei Themen.
Nachher (VTT):
WEBVTT
00:00:01.000 --> 00:00:04.000
Willkommen zur Präsentation.
00:00:05.500 --> 00:00:08.200
Heute behandeln wir drei Themen.
VTT-zu-SRT-Konvertierung
Um eine VTT-Datei in SRT zu konvertieren:
- Entfernen Sie den
WEBVTT-Header und alle Metadatenzeilen - Ersetzen Sie alle Punkte in Timecodes durch Kommas (
00:00:01.000wird zu00:00:01,000) - Fügen Sie fortlaufende Cue-Nummern vor jeder Timecode-Zeile hinzu
- Entfernen Sie alle VTT-spezifischen Features (Voice-Tags, Positionierung, CSS-Klassen)
- Speichern Sie die Datei mit der Endung
.srt
Automatisierte Konvertierung
Für Stapelkonvertierungen oder häufiges Formatwechseln erledigen Tools wie Vocova dies automatisch. Wenn Sie Untertitel aus Audio oder Video in Vocova generieren, können Sie direkt in sowohl SRT als auch VTT exportieren (zusammen mit PDF, DOCX, CSV und TXT), ohne manuelle Konvertierung. Dies ist besonders nützlich, wenn Sie denselben Inhalt in mehreren Formaten für verschiedene Plattformen benötigen.
Die meisten Videobearbeitungsanwendungen und Online-Untertitel-Editoren enthalten ebenfalls eine integrierte Formatkonvertierung. FFmpeg kann auf der Kommandozeile zwischen Formaten konvertieren:
ffmpeg -i subtitles.srt subtitles.vtt
Andere Untertitelformate, die Sie kennen sollten
SRT und VTT decken die Mehrheit der Anwendungsfälle ab, aber es gibt mehrere andere Formate für spezialisierte Anwendungen.
ASS / SSA (Advanced SubStation Alpha)
ASS und sein Vorgänger SSA sind Untertitelformate, die in der Anime-Fansubbing-Community beliebt sind. Sie unterstützen fortgeschrittenes Styling einschließlich Schriftarten, Farben, Animationen, Karaoke-Effekten und präziser Bildschirmpositionierung. ASS-Dateien sind deutlich komplexer als SRT oder VTT und werden hauptsächlich mit Mediaplayern wie VLC und MPC-HC verwendet. Die meisten Web-Plattformen akzeptieren ASS-Dateien nicht direkt.
TTML (Timed Text Markup Language)
TTML ist ein XML-basiertes Untertitelformat, das vom W3C gepflegt wird. Es wird in professionellen Broadcast- und Streaming-Workflows verwendet, insbesondere von Netflix, BBC und anderen großen Content-Distributoren. TTML unterstützt umfangreiches Styling, regionbasierte Positionierung und mehrere Untertitelspuren in einer einzigen Datei. Seine XML-Struktur macht es ausführlich, aber hochstrukturiert.
SCC (Scenarist Closed Captions)
SCC ist ein Legacy-Format, das im nordamerikanischen Broadcast-Fernsehen verwendet wird. Es kodiert CEA-608-Closed-Caption-Daten und ist für FCC-konforme Untertitelung in den Vereinigten Staaten erforderlich. SCC-Dateien sind nicht menschenlesbar und erfordern spezialisierte Software zum Erstellen und Bearbeiten. Wenn Sie Inhalte für Broadcast-TV produzieren, wird Ihr Untertitel-Anbieter wahrscheinlich SCC-Dateien liefern.
SBV (SubViewer)
SBV ist ein einfaches Untertitelformat, das historisch von YouTube für automatisch generierte Untertitel verwendet wurde. Es ist strukturell ähnlich wie SRT, verwendet aber ein anderes Timecode-Format. SBV wurde für YouTube-Uploads weitgehend von SRT und VTT abgelöst.
Häufig gestellte Fragen
Kann ich SRT-Dateien auf YouTube hochladen?
Ja. YouTube akzeptiert sowohl SRT- als auch VTT-Dateien für manuelle Untertitel-Uploads. Sie können sie über YouTube Studio im Abschnitt „Untertitel" eines beliebigen Videos hochladen. YouTube generiert auch automatisch Untertitel, die im SRT-Format heruntergeladen werden können.
Unterstützt VTT Styling und Farben?
Ja. VTT unterstützt CSS-Styling über das ::cue-Pseudo-Element, Inline-Tags wie <b>, <i> und <u> sowie klassenbasiertes Styling mit <c.classname>. Sie können Schriftfarbe, Hintergrundfarbe, Textgröße und Deckkraft steuern. Allerdings rendern nicht alle Videoplayer VTT-Styles – die Unterstützung hängt von der Player-Implementierung ab.
Welches Format ist besser für Barrierefreiheit?
VTT ist das empfohlene Format für die Web-Barrierefreiheitskonformität. Es integriert sich mit HTML5-Barrierefreiheits-APIs, unterstützt kind-Attribute (Captions, Descriptions, Chapters) und ermöglicht Sprecheridentifikation über Voice-Tags. Für die WCAG 2.1-Konformität bei Web-Video ist VTT mit dem <track>-Element der Standard-Ansatz.
Können SRT-Dateien Formatierungen wie Fett oder Kursiv enthalten?
Die SRT-Spezifikation enthält keine Formatierung. Viele Videoplayer interpretieren jedoch grundlegende HTML-Tags (<b>, <i>, <u>) innerhalb von SRT-Cues und rendern sie entsprechend. Dieses Verhalten ist nicht über alle Player hinweg garantiert, sodass es riskant ist, sich für kritische Formatierung darauf zu verlassen.
Was ist die maximale Dateigröße für Untertiteldateien?
Es gibt kein formatbezogenes Dateigrößenlimit für SRT oder VTT. Plattformspezifische Limits variieren: YouTube erlaubt Untertiteldateien bis 10 MB, während die meisten Plattformen Dateien weit unter 1 MB für typische Videolängen akzeptieren. Ein einstündiges Video erzeugt typischerweise eine Untertiteldatei zwischen 50-150 KB.
Wie generiere ich SRT- oder VTT-Dateien aus Audio oder Video?
Sie können Untertiteldateien generieren, indem Sie Ihr Audio oder Video mit einem automatischen Spracherkennungs-Tool transkribieren. Dienste wie Vocova transkribieren Audio in über 100 Sprachen mit Zeitstempeln und Sprecherkennzeichnungen und ermöglichen es Ihnen, direkt in SRT, VTT und andere Formate zu exportieren. Für einen Vergleich von Untertitel-Generierungstools siehe unseren Leitfaden zu den besten KI-Untertitelgeneratoren.