Formatos de archivos de subtítulos: guía completa de SRT, WebVTT, ASS, SBV, STL y TTML (2026)
Todos los formatos principales de subtítulos explicados con especificaciones, ejemplos de código, compatibilidad de plataformas y guía de decisión. Comparación de SRT, WebVTT, ASS/SSA, SBV, STL y TTML/DFXP para 2026.
Un archivo de subtítulos es un documento de texto plano que le indica a un reproductor de video qué texto mostrar, cuándo mostrarlo y -- opcionalmente -- cómo darle estilo y posicionarlo. Los siete formatos que importan en 2026 son SRT (base universal), WebVTT (nativo de la web, HTML5), ASS/SSA (estilos avanzados para anime y karaoke), SBV (formato interno de YouTube), STL (estándar de difusión europeo) y TTML/DFXP (estándar XML del W3C usado por Netflix y flujos de trabajo de difusión). Cada uno tiene una función específica, y usar el equivocado garantiza dolores de cabeza de compatibilidad.
Esta referencia cubre la especificación técnica, un ejemplo mínimo, el soporte de plataforma y un árbol de decisión para que puedas elegir el formato correcto a la primera. Si solo necesitas una comparación entre dos formatos, el artículo SRT vs VTT es más corto. Esta guía es el mapa completo.
Comparación rápida
| Formato | Extensión | Estilos | Posicionamiento | Uso principal | Cobertura de plataformas |
|---|---|---|---|---|---|
| SRT | .srt | Mínimos (cursiva, negrita, subrayado) | Ninguno | Reproducción universal de video | Casi universal |
| WebVTT | .vtt | Basados en CSS | Completo (x, y, align) | Video HTML5, web | Todos los navegadores modernos |
| ASS / SSA | .ass, .ssa | Ricos (fuentes, colores, efectos) | Completo | Anime, karaoke, subtítulos estilizados | VLC, MPV, Aegisub |
| SBV | .sbv | Ninguno | Ninguno | Cargas en YouTube | Solo YouTube Studio |
| STL (EBU) | .stl | Seguros para difusión | Sí | TV europea | Difusión profesional |
| TTML / DFXP | .ttml, .dfxp, .xml | XML + CSS | Completo | OTT, difusión, Netflix | Netflix, flujos de trabajo SMPTE |
Todos los formatos principales son texto plano legible por humanos, excepto algunas variantes de STL. Cualquiera de ellos puede convertirse a otro, aunque se pierden los estilos al pasar de formatos más ricos a más simples.
SRT (SubRip Text)
SRT es el mínimo común denominador de los formatos de subtítulos. Fue diseñado para la herramienta de ripeo de DVD SubRip a principios de la década de 2000, y su simplicidad es precisamente por lo que se volvió universal: prácticamente todos los reproductores de video, editores de video y plataformas de streaming lo admiten.
Estructura. Un archivo SRT es una secuencia de cues, cada uno con un índice numérico, una marca de tiempo de inicio y fin separadas por -->, y una o más líneas de texto. Los cues están separados por una línea en blanco. Las marcas de tiempo usan HH:MM:SS,mmm (coma como separador decimal).
Ejemplo mínimo:
1
00:00:01,000 --> 00:00:03,500
Bienvenido al video.
2
00:00:04,000 --> 00:00:07,200
Los subtítulos hacen que el contenido sea accesible
para audiencias globales.
Estilos. SRT admite un pequeño subconjunto de etiquetas similares a HTML: <i>cursiva</i>, <b>negrita</b>, <u>subrayado</u> y <font color="#ff0000">color</font>. El soporte de etiquetas varía según el reproductor. Cualquier cosa más allá de esto no es portátil.
Limitaciones. Sin posicionamiento, sin texto vertical, sin animación, sin control CSS preciso. Se admite Unicode, pero algunos reproductores más antiguos asumen Windows-1252 o Latin-1, por lo que conviene guardar como UTF-8 sin BOM para máxima compatibilidad.
Cuándo usarlo. Opción predeterminada para cargas en plataformas de video, reproducción local y cualquier lugar donde necesites máxima compatibilidad.
WebVTT (Web Video Text Tracks)
WebVTT es el estándar del W3C para leyendas de video HTML5. Se diseñó para ser compatible con SRT en superficie, al tiempo que agrega las funciones que la web realmente necesita: estilos CSS, posicionamiento, cues de metadatos y marcadores de capítulo.
Estructura. Comienza con un encabezado WEBVTT, seguido de cues. Las marcas de tiempo usan HH:MM:SS.mmm (punto como separador decimal, no coma). Los cues pueden llevar indicaciones de estilo y posicionamiento en línea.
Ejemplo mínimo:
WEBVTT
1
00:00:01.000 --> 00:00:03.500
Bienvenido al video.
2
00:00:04.000 --> 00:00:07.200 line:80% position:50% align:center
Los subtítulos hacen que el contenido sea accesible
para audiencias globales.
Estilos. Admite CSS a través de los pseudoelementos ::cue y ::cue(selector) en una hoja de estilos, o bloques STYLE directamente en el archivo VTT. Obtienes control sobre color, fondo, fuente, tamaño de fuente, peso y efectos de sombra.
Posicionamiento. Los ajustes de cue (line, position, size, align, vertical) controlan dónde aparece el texto. Esta es la principal ventaja funcional sobre SRT.
Extensiones. Admite bloques NOTE para comentarios, bloques STYLE para CSS embebido y pistas de capítulos/metadatos mediante el atributo kind en el elemento HTML <track>.
Cuándo usarlo. Video HTML5, reproductores web, marcadores de capítulo y cualquier lugar donde necesites control a nivel de CSS sobre la apariencia de las leyendas.
ASS / SSA (Advanced SubStation Alpha)
ASS (Advanced SubStation Alpha) y su predecesor SSA son el formato pesado del mundo de los subtítulos. Originalmente desarrollado para la herramienta de subtitulado de karaoke y anime SubStation Alpha, ASS proporciona las opciones de estilo más ricas de cualquier formato de subtítulos ampliamente utilizado.
Estructura. Secciones tipo INI: [Script Info], [V4+ Styles], [Events]. Los eventos son los cues reales de los subtítulos, cada uno con una capa, tiempo de inicio/fin, nombre de estilo y texto. El texto puede contener etiquetas de anulación en línea entre llaves ({\b1}negrita{\b0}, {\c&H00FFFF&}amarillo, {\pos(100,200)}posicionado).
Ejemplo mínimo:
[Script Info]
Title: Example
ScriptType: v4.00+
PlayResX: 1920
PlayResY: 1080
[V4+ Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding
Style: Default,Arial,48,&H00FFFFFF,&H000000FF,&H00000000,&H80000000,0,0,0,0,100,100,0,0,1,2,2,2,10,10,10,1
[Events]
Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
Dialogue: 0,0:00:01.00,0:00:03.50,Default,,0,0,0,,Bienvenido al video.
Dialogue: 0,0:00:04.00,0:00:07.20,Default,,0,0,0,,{\b1}Los subtítulos{\b0} importan.
Estilos. Estilos con nombre definidos una vez y aplicados a muchos cues. Las anulaciones en línea pueden animar propiedades (\t(start,end,\fscx120) escala horizontalmente entre dos tiempos), rotar el texto, aplicar sombras y contornos, y dibujar gráficos vectoriales usando los comandos \p1 ... \p0.
Cuándo usarlo. Fansubs de anime, letras de karaoke, leyendas altamente estilizadas y cualquier momento en que necesites control de nivel de producción sobre tipografía y posicionamiento. Excesivo para la mayoría de los casos de uso.
Compatibilidad. VLC, MPV, mpv.net y la mayoría de los reproductores de la comunidad anime admiten ASS por completo. Los reproductores web generalmente no. YouTube elimina los estilos ASS al cargar.
SBV (formato de YouTube)
SBV es el formato de subtítulos interno histórico de YouTube. Es esencialmente un SRT simplificado sin índices ni estilos. YouTube Studio todavía acepta SBV junto con SRT, VTT, TTML y varios otros formatos.
Estructura. Marcas de tiempo separadas por una coma, seguidas del texto del subtítulo. Los cues se separan por líneas en blanco. Las marcas de tiempo usan H:MM:SS.mmm.
Ejemplo mínimo:
0:00:01.000,0:00:03.500
Bienvenido al video.
0:00:04.000,0:00:07.200
Los subtítulos hacen que el contenido sea accesible
para audiencias globales.
Cuándo usarlo. Casi nunca, fuera del caso concreto de cargar directamente en YouTube cuando ya tienes exportaciones SBV de una herramienta. Para flujos de trabajo nuevos, usa SRT o VTT; YouTube acepta ambos.
STL (formato de intercambio de datos de subtitulado EBU)
EBU-STL es el formato binario de intercambio de subtítulos de la Unión Europea de Radiodifusión, estandarizado en EBU Tech 3264. Es el formato dominante en la televisión de difusión europea y es requerido por muchos radiodifusores públicos para la entrega.
Estructura. Contenedor binario con un encabezado de información general de subtítulos (GSI) seguido de una secuencia de bloques de información de texto y tiempos (TTI), cada uno de 128 bytes. El bloque GSI codifica metadatos como idioma, conjunto de caracteres, velocidad de cuadros y relación de aspecto. Cada bloque TTI es un único cue con números precisos de cuadro de entrada/salida y atributos de estilo.
Estilos. Admite atributos de color y posicionamiento al estilo teletexto, caracteres de doble altura y fondos en caja. La salida está visualmente restringida para coincidir con las capacidades tradicionales de leyendas de difusión.
Cuándo usarlo. Entrega de difusión a redes de televisión europeas (BBC, ZDF, France Télévisions, etc.). Si no trabajas en difusión profesional, no tocarás este formato.
Compatibilidad. El software de difusión profesional (EZTitles, WinCAPS, Subtitle Workshop) maneja STL. Los reproductores de video de consumo no.
TTML y DFXP (W3C Timed Text Markup Language)
TTML (Timed Text Markup Language) es el formato basado en XML del W3C que se ha convertido en la columna vertebral de la entrega profesional OTT (over-the-top) y de streaming. DFXP es el perfil de TTML originalmente estandarizado por el W3C, e IMSC (SMPTE-TT) es un perfil más ajustado utilizado por los radiodifusores y Netflix.
Estructura. Documento XML con un elemento raíz <tt> que contiene <head> (estilos, regiones, metadatos) y <body> (divisiones que contienen párrafos, cada uno representando un cue de subtítulo con tiempos de inicio/fin).
Ejemplo mínimo:
<?xml version="1.0" encoding="UTF-8"?>
<tt xmlns="http://www.w3.org/ns/ttml" xml:lang="en">
<head>
<styling>
<style xml:id="default" tts:color="white" tts:fontFamily="Arial" tts:fontSize="100%"/>
</styling>
</head>
<body>
<div style="default">
<p begin="00:00:01.000" end="00:00:03.500">Bienvenido al video.</p>
<p begin="00:00:04.000" end="00:00:07.200">Los subtítulos hacen que el contenido sea accesible<br/>para audiencias globales.</p>
</div>
</body>
</tt>
Estilos. Estilos completos similares a CSS en línea o mediante definiciones de estilo. Admite regiones para posicionamiento, animaciones mediante elementos <set>, anotaciones ruby para tipografía de Asia Oriental y semántica de texto enriquecido.
Cuándo usarlo. Entrega a Netflix, plataformas OTT, flujos de trabajo de difusión que requieren perfiles SMPTE-TT o IMSC, y cualquier lugar donde necesites estilos precisos que sobrevivan a las canalizaciones de procesamiento.
Compatibilidad. Netflix requiere IMSC 1.1. Amazon Prime, Hulu y Disney+ aceptan variantes de TTML. Apple TV usa iTunes Timed Text (iTT), un perfil de TTML. Los reproductores de consumo generalmente prefieren SRT o VTT.
Matriz de compatibilidad de plataformas
| Plataforma | SRT | VTT | ASS/SSA | SBV | STL | TTML/DFXP |
|---|---|---|---|---|---|---|
| YouTube (carga) | ✅ | ✅ | ❌ | ✅ | ❌ | ✅ |
| Vimeo | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| Netflix (entrega) | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ (IMSC) |
| Amazon Prime (entrega) | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ |
HTML5 <track> | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ |
| VLC | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ |
| MPV | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ |
| Adobe Premiere Pro | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ |
| DaVinci Resolve | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ |
| Final Cut Pro | ✅ | ✅ | ❌ | ❌ | ❌ | ✅ (iTT) |
| TikTok / Instagram Reels | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
"Entrega" significa que la plataforma acepta ese formato en su canalización de ingesta, no que se reproduzca directamente en la aplicación del consumidor.
Árbol de decisión: ¿qué formato deberías usar?
Responde estas preguntas en orden. El primer sí es tu formato.
- ¿Estás entregando a Netflix u otro servicio OTT importante? Usa TTML / IMSC 1.1. Es un requisito estricto, no una preferencia.
- ¿Estás entregando a TV de difusión europea? Usa EBU-STL. Consulta la especificación de entrega del radiodifusor específico para la variante exacta de STL.
- ¿Necesitas subtítulos estilizados para anime, karaoke o contenido cargado de tipografía? Usa ASS / SSA. Ningún otro formato te da un control comparable.
- ¿Estás incrustando en video HTML5 en la web? Usa WebVTT. Es el formato nativo para el elemento
<track>. - ¿Estás subiendo a YouTube? Usa SRT (la entrada preferida de YouTube) o VTT. Omite SBV a menos que tengas un flujo de trabajo heredado.
- ¿Necesitas la máxima compatibilidad en reproductores desconocidos? Usa SRT. Nada está más universalmente soportado.
Para la mayoría de los creadores de contenido -- podcasters, YouTubers, creadores de cursos -- la respuesta es casi siempre SRT o WebVTT. Los formatos exóticos son relevantes solo cuando una plataforma o cliente específicos los imponen.
Conversión entre formatos
Los siete formatos son convertibles, pero cada conversión pierde información en una dirección. Pasar de un formato rico (ASS, TTML) a uno simple (SRT, SBV) elimina los estilos y el posicionamiento. Ir en la dirección contraria preserva el texto, pero no puede recrear los estilos de origen.
Herramientas de conversión comunes:
- FFmpeg:
ffmpeg -i input.ass output.srtmaneja la mayoría de las conversiones de subtítulos, incluyendo la reducción a texto plano. - Subtitle Edit (Windows, gratuito): GUI para convertir entre ~30 formatos de subtítulos con vista previa visual.
- Aegisub (multiplataforma, gratuito): Editor especializado en ASS que importa y exporta a SRT y VTT.
- Conversores en línea: Útiles para conversiones puntuales, pero evítalos para contenido sensible (las cargas salen de tu control).
La conversión programática es sencilla para pares de formatos que comparten un modelo basado en cues (SRT, VTT, SBV, eventos ASS). Los formatos XML (TTML/DFXP) necesitan un analizador adecuado debido a los espacios de nombres y elementos anidados.
Codificación de caracteres y Unicode
Todos los formatos modernos de subtítulos admiten UTF-8 y esta es la única codificación que deberías usar en 2026. Los archivos heredados pueden estar en Windows-1252, Latin-1, Shift-JIS o GB2312: si tu texto se renderiza como ?????? o é en lugar de é, el archivo está en la codificación equivocada. La mayoría de los editores te permiten volver a guardar como UTF-8.
Un error que hay que vigilar: no guardes UTF-8 con marca de orden de bytes (BOM). La BOM son tres bytes invisibles al principio del archivo que confunden a los analizadores SRT más antiguos y a algunas canalizaciones de streaming. En VS Code, usa "Guardar con codificación → UTF-8" en lugar de "UTF-8 with BOM".
Generar subtítulos a partir de audio
Los servicios modernos de transcripción producen directamente a la mayoría de los formatos de subtítulos. La canalización típica es:
- Sube o pega el audio/video de origen
- Elige el formato o formatos de salida: SRT, VTT, TXT o DOCX
- Descarga el archivo generado y adjúntalo a tu video
Vocova admite la exportación a SRT, VTT, DRCX (Descript), texto plano y PDF con marcas de tiempo, cubriendo todas las necesidades prácticas de los creadores de contenido y la mayoría de los flujos de trabajo profesionales. Si necesitas TTML, ASS o STL, el enfoque estándar es exportar primero a SRT y luego convertir usando las herramientas enumeradas arriba.
Para un recorrido más profundo sobre la generación de subtítulos a partir de video, consulta la guía de generadores de subtítulos con IA.
Preguntas frecuentes
¿Cuál es el formato de subtítulos más ampliamente utilizado?
SRT es el formato de subtítulos más ampliamente utilizado en 2026. Es compatible con esencialmente todos los reproductores de video, editores de video y plataformas de streaming, y su simplicidad lo convierte en la salida predeterminada de la mayoría de las herramientas de transcripción.
¿Cuál es la diferencia entre SRT y VTT?
SRT es el formato universal heredado con estilos mínimos y sin posicionamiento. WebVTT es el estándar moderno HTML5 con estilos CSS completos, posicionamiento y marcadores de capítulo. WebVTT usa puntos en las marcas de tiempo (.), mientras que SRT usa comas (,).
¿YouTube admite WebVTT?
Sí. YouTube Studio acepta WebVTT, SRT, SBV, TTML, SAMI y varios otros formatos al cargar. SRT es la opción más común porque es el más sencillo de generar y editar.
¿Puedo usar archivos de subtítulos para cumplimiento de accesibilidad?
Sí. Todos los formatos enumerados pueden servir como subtítulos cerrados cuando incluyen identificación de hablantes y sonidos no verbales ([suena música], [portazo]). Transcripción para accesibilidad cubre los requisitos específicos de WCAG.
¿Qué formato requiere Netflix?
Netflix requiere IMSC 1.1, un perfil de TTML. Las especificaciones de entrega imponen restricciones específicas de estilos, tiempos y metadatos que van más allá del TTML genérico. Netflix publica su Timed Text Style Guide para proveedores que necesitan cumplir con la especificación.
¿Sigue usándose ASS en 2026?
Sí, ASS sigue siendo el estándar para fansubs de anime, subtítulos al estilo karaoke y cualquier caso de uso que necesite un control tipográfico más allá de lo que ofrece VTT. No ha sido deprecado y continúa recibiendo actualizaciones de herramientas comunitarias.
¿Cómo añado estilos a SRT?
SRT admite un pequeño conjunto de etiquetas HTML en línea: <i>, <b>, <u> y <font color="...">. Cualquier cosa más avanzada requiere cambiar a VTT o ASS.
Resumen
El formato de subtítulos adecuado depende de a dónde va tu archivo, no de una preferencia personal. SRT para compatibilidad universal, WebVTT para la web, ASS para tipografía estilizada, TTML para entrega OTT, STL para difusión europea y SBV casi nunca. Todo en Unicode UTF-8 sin BOM, y convierte entre formatos usando FFmpeg o Subtitle Edit cuando una plataforma requiera una entrada específica.
Si estás iniciando un flujo de trabajo de transcripción, genera primero SRT o VTT: cubren el 90% de las necesidades de los creadores de contenido, y cualquier otro formato está a una conversión de distancia.
Fuentes y lecturas adicionales
- Especificación W3C Timed Text Markup Language 2
- Especificación W3C WebVTT
- EBU Tech 3264: formato de intercambio de datos de subtitulado
- Descripción general del formato SubRip Text (SRT), documentos de Matroska
- Especificación IMSC 1.1 (W3C)
- Comparación detallada SRT vs VTT
- Subtítulos cerrados vs subtítulos
