Audio- und Videotranskribierer
Fügen Sie eine Audio- oder Videodatei ein und erhalten Sie ein genaues Transkript sowie gebrauchsfertige SRT- und VTT-Untertitel – 100 % in Ihrem Browser, ohne dass etwas hochgeladen werden muss.
MP3, WAV, M4A, MP4, MOV and more. Everything runs in your browser — your file is never uploaded.
SRT and VTT subtitle files use the AI's time-codes — drop them into YouTube, Premiere, DaVinci Resolve or CapCut. Edit the text above before downloading the .txt if needed.
Dieser Transkriptor wandelt Sprache in jeder Audio- oder Videodatei mithilfe eines KI-Spracherkennungsmodells (OpenAI Whisper) in Text um, das vollständig in Ihrem Browser ausgeführt wird – Ihre Datei wird also nie auf einen Server hochgeladen und bleibt völlig privat. Fügen Sie eine MP3-, WAV-, M4A-, MP4- oder ähnliche Datei ein und es werden ein sauberes Transkript sowie zeitcodierte SRT- und VTT-Untertiteldateien zurückgegeben, die Sie auf YouTube, Premiere, CapCut oder einem anderen Videoeditor verwenden können. Es funktioniert in Dutzenden von Sprachen, hat keine Längenbeschränkung oder Anmeldung und ist kostenlos. Das KI-Modell wird bei der ersten Verwendung einmal heruntergeladen (dann wird es zwischengespeichert) und eine GPU (WebGPU) beschleunigt es automatisch, wenn verfügbar.
Häufig gestellte Fragen
Ist dieser Audio-zu-Text-Transkriptor wirklich kostenlos und privat?
Ja – es ist völlig kostenlos, ohne Anmeldung und von Natur aus privat: Das Sprachmodell läuft in Ihrem Browser, sodass Ihre Audio- oder Videodatei Ihr Gerät nie verlässt und nie auf einen Server hochgeladen wird.
Lädt es meine Datei auf einen Server hoch?
Nein. Die Transkription erfolgt zu 100 % auf Ihrem eigenen Gerät mithilfe eines KI-Modells im Browser. Nichts wird irgendwohin gesendet, weshalb es sicher für sensible Aufzeichnungen wie Besprechungen, Interviews oder Sprachnotizen ist.
Kann ich SRT- oder VTT-Untertitel erhalten, nicht nur Text?
Ja. Zusammen mit dem Nur-Text-Transkript erhalten Sie zeitcodierte SRT- und VTT-Untertiteldateien zum Herunterladen, die Sie in YouTube, Premiere Pro, DaVinci Resolve, CapCut oder einen anderen Untertitel-Workflow einfügen können.
Welche Audio- und Videoformate und Sprachen werden unterstützt?
Die meisten gängigen Formate funktionieren – MP3, WAV, M4A, OGG, FLAC sowie MP4 und andere Videos (die Audiospur wird automatisch gelesen). Das Whisper-Modell versteht Dutzende Sprachen und transkribiert sie in ihrer eigenen Schrift.
Wie genau ist die Transkription?
Es nutzt OpenAI Whisper, eines der besten offenen Spracherkennungsmodelle, sodass klare Sprache sehr genau transkribiert wird. Hintergrundgeräusche, starke Akzente oder überlappende Sprecher können die Genauigkeit beeinträchtigen – Sie können das Transkript vor dem Export schnell bearbeiten.
Warum wird beim ersten Mal etwas heruntergeladen?
Das KI-Sprachmodell (einige Dutzend MB) wird bei der ersten Verwendung einmal heruntergeladen und dann von Ihrem Browser zwischengespeichert, sodass spätere Transkriptionen sofort beginnen können. Auf einem Gerät mit WebGPU läuft es spürbar schneller.