Transcripteur audio et vidéo

Déposez un fichier audio ou vidéo et obtenez une transcription précise ainsi que des sous-titres SRT et VTT prêts à l'emploi — 100 % dans votre navigateur, sans rien télécharger.

MP3, WAV, M4A, MP4, MOV and more. Everything runs in your browser — your file is never uploaded.

Ce transcripteur transforme la parole de n'importe quel fichier audio ou vidéo en texte à l'aide d'un modèle de reconnaissance vocale AI (OpenAI Whisper) qui s'exécute entièrement dans votre navigateur — de sorte que votre fichier n'est jamais téléchargé sur un serveur et reste complètement privé. Déposez un fichier MP3, WAV, M4A, MP4 ou similaire et il renvoie une transcription propre ainsi que des fichiers de sous-titres SRT et VTT codés dans le temps que vous pouvez utiliser sur YouTube, Premiere, CapCut ou tout autre éditeur vidéo. Il fonctionne dans des dizaines de langues, n’a pas de limite de longueur ni d’inscription et est gratuit. Le modèle d'IA se télécharge une fois lors de la première utilisation (il est ensuite mis en cache) et un GPU (WebGPU) l'accélère automatiquement lorsqu'il est disponible.

Foire aux questions

Ce transcripteur audio en texte est-il vraiment gratuit et privé ?

Oui, c'est entièrement gratuit, sans inscription, et privé de par sa conception : le modèle vocal s'exécute dans votre navigateur, de sorte que votre fichier audio ou vidéo ne quitte jamais votre appareil et n'est jamais téléchargé sur un serveur.

Est-ce qu'il télécharge mon fichier sur un serveur ?

Non. La transcription s'effectue à 100 % sur votre propre appareil à l'aide d'un modèle d'IA intégré au navigateur. Rien n'est envoyé nulle part, c'est pourquoi il est sans danger pour les enregistrements sensibles comme les réunions, les interviews ou les notes vocales.

Puis-je obtenir des sous-titres SRT ou VTT, pas seulement du texte ?

Oui. En plus de la transcription en texte brut, vous obtenez des fichiers de sous-titres SRT et VTT codés dans le temps à télécharger, prêts à être déposés dans YouTube, Premiere Pro, DaVinci Resolve, CapCut ou tout autre flux de sous-titres.

Quels formats et langues audio et vidéo sont pris en charge ?

Les formats les plus courants fonctionnent : MP3, WAV, M4A, OGG, FLAC, ainsi que MP4 et autres vidéos (la piste audio est lue automatiquement). Le modèle Whisper comprend des dizaines de langues et les transcrit dans leur propre script.

Quelle est la précision de la transcription ?

Il utilise OpenAI Whisper, l'un des meilleurs modèles ouverts de reconnaissance vocale, afin que la parole claire soit transcrite de manière très précise. Le bruit de fond, les accents prononcés ou les haut-parleurs qui se chevauchent peuvent réduire la précision. Vous pouvez rapidement modifier la transcription avant de l'exporter.

Pourquoi télécharge-t-il quelque chose la première fois ?

Le modèle vocal de l'IA (quelques dizaines de Mo) est téléchargé une seule fois lors de la première utilisation et est ensuite mis en cache par votre navigateur, de sorte que les transcriptions ultérieures démarrent instantanément. Un appareil doté de WebGPU l'exécute sensiblement plus rapidement.