Transcriptor de audio y vídeo
Introduzca un archivo de audio o vídeo y obtenga una transcripción precisa además de subtítulos SRT y VTT listos para usar, 100% en su navegador, sin cargar nada.
MP3, WAV, M4A, MP4, MOV and more. Everything runs in your browser — your file is never uploaded.
SRT and VTT subtitle files use the AI's time-codes — drop them into YouTube, Premiere, DaVinci Resolve or CapCut. Edit the text above before downloading the .txt if needed.
Este transcriptor convierte la voz de cualquier archivo de audio o video en texto utilizando un modelo de reconocimiento de voz con IA (OpenAI Whisper) que se ejecuta completamente dentro de su navegador, por lo que su archivo nunca se carga en un servidor y permanece completamente privado. Introduzca un archivo MP3, WAV, M4A, MP4 o similar y obtendrá una transcripción limpia además de archivos de subtítulos SRT y VTT con código de tiempo que puede usar en YouTube, Premiere, CapCut o cualquier editor de video. Funciona en docenas de idiomas, no tiene límites de longitud ni registro y es gratuito. El modelo de IA se descarga una vez cuando se usa por primera vez (luego se almacena en caché) y una GPU (WebGPU) lo acelera automáticamente cuando está disponible.
Preguntas frecuentes
¿Este transcriptor de audio a texto es realmente gratuito y privado?
Sí, es completamente gratuito, no requiere registro y tiene un diseño privado: el modelo de voz se ejecuta dentro de su navegador, por lo que su archivo de audio o video nunca sale de su dispositivo y nunca se carga en ningún servidor.
¿Sube mi archivo a un servidor?
No. La transcripción se realiza 100 % en su propio dispositivo utilizando un modelo de IA en el navegador. No se envía nada a ninguna parte, por lo que es seguro para grabaciones confidenciales como reuniones, entrevistas o notas de voz.
¿Puedo obtener subtítulos SRT o VTT, no sólo texto?
Sí. Junto con la transcripción de texto sin formato, obtienes archivos de subtítulos SRT y VTT con código de tiempo para descargar, listos para insertar en YouTube, Premiere Pro, DaVinci Resolve, CapCut o cualquier flujo de trabajo de subtítulos.
¿Qué formatos e idiomas de audio y vídeo son compatibles?
Los formatos más comunes funcionan: MP3, WAV, M4A, OGG, FLAC, además de MP4 y otros vídeos (la pista de audio se lee automáticamente). El modelo Whisper comprende docenas de idiomas y los transcribe en su propia escritura.
¿Qué tan precisa es la transcripción?
Utiliza OpenAI Whisper, uno de los mejores modelos abiertos de reconocimiento de voz, por lo que el habla clara se transcribe con mucha precisión. El ruido de fondo, los acentos fuertes o la superposición de hablantes pueden reducir la precisión; puede editar rápidamente la transcripción antes de exportarla.
¿Por qué descarga algo la primera vez?
El modelo de voz de IA (unas pocas decenas de MB) se descarga una vez cuando se usa por primera vez y luego su navegador lo almacena en caché, por lo que las transcripciones posteriores comienzan instantáneamente. Un dispositivo con WebGPU lo ejecuta notablemente más rápido.