Cómo transcribir una reunión de Zoom: de la grabación a una transcripción limpia y un resumen con IA
Para transcribir una reunión de Zoom tienes dos vías: activar la transcripción de audio propia de Zoom (que necesita un plan de pago con grabación en la nube y guarda la transcripción como archivo VTT), o grabar la llamada y subir ese archivo a una herramienta de transcripción específica para obtener una transcripción más limpia, con identificación de hablantes y un resumen con IA estructurado. A continuación recorro ambas vías, muestro dónde están los muros de Zoom y detallo los pasos exactos de la segunda. Con total transparencia: yo dirijo Subanana, así que lo usaré para el recorrido de subida.

¿Puede Zoom transcribir una reunión por sí solo?
Sí, pero la transcripción utilizable es una función de pago, no los subtítulos en directo gratuitos. Hay tres funciones distintas de Zoom relacionadas con la conversión de voz a texto, y la gente las confunde:
- Los subtítulos en directo muestran las palabras en pantalla durante la llamada. Útiles en el momento, pero según una FAQ del soporte de Zoom de mayo de 2026, tras un despliegue de ese mes los participantes ya no pueden guardar ni descargar esos subtítulos como archivo para después de la reunión, de modo que los subtítulos ya no sirven para conservar un registro.
- La transcripción de audio de la grabación en la nube es la transcripción de verdad. Según la documentación de Zoom, cuando grabas una reunión en la nube Zoom la transcribe automáticamente y guarda el resultado como un archivo VTT consultable y editable. Esto necesita una cuenta de pago (Pro, Business, Education o Enterprise) con la grabación en la nube activada; una cuenta Basic gratuita no tiene ninguna de las dos cosas.
- El resumen de reunión del AI Companion convierte la conversación en un resumen. Según la documentación del soporte de Zoom, un usuario con licencia en un plan de pago Zoom Workplace puede hacer que el AI Companion genere un resumen; el anfitrión tiene que iniciarlo (no está activado por defecto), y el resumen llega al correo, a Zoom Team Chat y a Zoom Hub.
Así que si ya pagas por Zoom, grabas tus llamadas en la nube y tus reuniones son mayormente en un solo idioma, Zoom te entrega una transcripción y un resumen aceptables sin ninguna herramienta extra. La fricción aparece en los márgenes.
¿Cuáles son los límites de la transcripción integrada de Zoom?
Hay un par de cosas que suelen hacer tropezar a la gente:
- Está bloqueada tras dos muros de pago. La transcripción necesita un plan de pago con la grabación en la nube activada; el resumen necesita el AI Companion en un nivel Zoom Workplace. El plan gratuito no te da ninguno de los dos, y los subtítulos en directo que sí puedes ver ya no se pueden guardar.
- El inglés es el idioma por defecto. La transcripción de la grabación en la nube de Zoom está por defecto en inglés y admite un conjunto de idiomas de transcripción más reducido de lo que cabría esperar (Zoom indica más de 18). Sus subtítulos en directo traducidos cubren 33 idiomas según la página de funciones de Zoom, pero esa es la función de subtítulos en directo, no la transcripción guardada.
- Da por hecho un solo idioma por reunión. La transcripción se genera en un único idioma configurado. Si tu llamada mezcla idiomas —un equipo internacional que cambia entre el inglés y otro idioma a mitad de conversación—, una transcripción monolingüe lo gestiona mal.
- El resultado es un archivo de subtítulos VTT. Eso está bien para subtítulos, pero un VTT en bruto con marcas de tiempo cada pocos segundos no es una transcripción limpia, dividida en párrafos, que pegarías en un acta. La última milla de limpieza te queda a ti.
Para ser justos: si tu organización ya paga por Zoom Workplace con el AI Companion, graba todo en la nube y mantiene llamadas en un solo idioma, la vía nativa es la de menor resistencia y probablemente no necesites nada más.
¿Cómo se transcribe una grabación de Zoom con Subanana?
Subanana no se une a tu llamada de Zoom: no hay ningún bot de Zoom, por diseño. En su lugar, grabas la reunión en Zoom (tanto la grabación en la nube como la local producen un archivo) y luego subes ese archivo de audio o vídeo a la transcripción de reuniones de Subanana. A partir de la grabación, Subanana produce una transcripción limpia con identificación de hablantes y puntuación automática, y luego la organiza en un resumen con IA estructurado: puntos clave, decisiones, tareas pendientes.
Lo que esto te aporta frente al VTT en bruto:
- Identificación de hablantes y formato legible. La diarización separa quién dijo qué, y el modo transcripción añade puntuación y saltos de párrafo, de modo que el resultado se lee como un acta y no como una pista de subtítulos.
- Un resumen que puedes dirigir. Eliges en un menú por niveles qué gran modelo de lenguaje redacta el resumen, y puedes aplicar una plantilla integrada (reunión, entrevista y otras) para que la estructura se ajuste a cómo tu equipo registra las decisiones.
- Gestión multilingüe. Subanana transcribe y traduce en más de 80 idiomas, así que una llamada de Zoom con varios idiomas o una reunión no anglófona no es un caso de segunda categoría.
- Opciones de exportación reales. Exporta la transcripción y el resumen como SRT, VTT, TXT, DOCX, XLSX o Markdown, no solo como archivo de subtítulos. (La exportación es una función de pago.)
- Haz preguntas a la transcripción. El chat con IA dentro de la app te permite consultar la reunión —«qué decidimos sobre el presupuesto», «quién se encarga del seguimiento»— a partir de lo que realmente se dijo.
Por dentro, Subanana compara varios modelos de voz a texto y dirige cada grabación al que mejor rinde para ese idioma, con repliegue automático a otro modelo si uno produce un segmento malo, y esos reintentos internos no se te cobran aparte.
Zoom nativo vs. grabar y subir a Subanana
| Lo que necesitas | Transcripción integrada de Zoom | Grabar y luego subir a Subanana |
|---|---|---|
| Conseguir alguna transcripción | Plan de pago + grabación en la nube activada | Funciona con cualquier grabación de Zoom (en la nube o local) |
| Guardar los subtítulos en directo | Ya no se pueden guardar tras el cambio de mayo de 2026 | No aplica: transcribes la grabación |
| Identificación de hablantes | Sí, en la transcripción de la grabación en la nube | Sí, con diarización |
| Párrafos limpios vs. archivo de subtítulos | Archivo de subtítulos VTT con marcas de tiempo | Transcripción puntuada y dividida en párrafos |
| Resumen con IA | AI Companion (aparte, el anfitrión debe iniciarlo) | Integrado; eliges el modelo + una plantilla |
| Llamadas multilingües / con varios idiomas | Un solo idioma configurado; más de 18 admitidos | Más de 80 idiomas, transcribir + traducir |
| Formatos de exportación | VTT | SRT, VTT, TXT, DOCX, XLSX, Markdown |
Zoom gana en comodidad si ya estás dentro de su ecosistema de pago: nada que subir, la transcripción simplemente está ahí. Subanana gana cuando la grabación es el punto de partida y quieres obtener de ella un registro utilizable y multilingüe.
Los pasos concretos
- En Zoom, graba la reunión: tanto la grabación en la nube (de pago) como una grabación local guardan un archivo que podrás usar después.
- Cuando la reunión termine y Zoom acabe de procesarla, descarga la grabación (audio o vídeo) a tu ordenador.
- Abre Subanana, inicia una transcripción de reunión y sube ese archivo. Define el idioma de origen; añade un idioma de destino para traducir si tu reunión lo necesita.
- Deja que se procese y luego revisa: la identificación de hablantes y la puntuación se aplican automáticamente, y el resumen con IA extrae las decisiones y las tareas pendientes. Elige otro modelo u otra plantilla si quieres un enfoque distinto.
- Corrige y luego exporta la transcripción y el resumen en el formato que necesites (la exportación es una función de pago).
¿Cuándo basta con la transcripción propia de Zoom?
Si la transcripción y la grabación en la nube ya están activadas en toda tu organización, pagas por el AI Companion para generar resúmenes y tus reuniones son mayormente en un solo idioma, quédate con Zoom: es la menor fricción. Pero en cuanto te topas con cualquiera de estos puntos —no pagas por los niveles que desbloquean la transcripción o el resumen, tus reuniones abarcan más de un idioma, o quieres un registro limpio dividido en párrafos con resúmenes dirigibles en lugar de un archivo de subtítulos VTT—, grabar la llamada y pasarla por la transcripción de reuniones con IA de Subanana suele ser la vía más limpia. Puedes ver los planes en la página de precios.
Un registro de reunión son en realidad dos problemas: si la herramienta puede captar las palabras, y si puedes usar de verdad lo que sale. Zoom capta bien las palabras una vez que estás en un plan de pago. El segundo problema —convertir eso en un registro limpio, multilingüe y estructurado que puedas pasar a otros— es donde grabar y llevarlo a una herramienta de transcripción específica se gana su sitio.