Transkrip Audio & Video

Masukkan file audio atau video dan dapatkan transkrip akurat ditambah subtitle SRT dan VTT yang siap digunakan — 100% di browser Anda, tanpa ada yang diunggah.

MP3, WAV, M4A, MP4, MOV and more. Everything runs in your browser — your file is never uploaded.

Transcriber ini mengubah ucapan dalam file audio atau video apa pun menjadi teks menggunakan model pengenalan ucapan AI (OpenAI Whisper) yang berjalan sepenuhnya di dalam browser Anda — sehingga file Anda tidak pernah diunggah ke server dan tetap sepenuhnya bersifat pribadi. Masukkan file MP3, WAV, M4A, MP4 atau serupa, dan ini akan mengembalikan transkrip bersih ditambah file subtitle SRT dan VTT berkode waktu yang dapat Anda gunakan di YouTube, Premiere, CapCut, atau editor video apa pun. Ia berfungsi dalam banyak bahasa, tidak memiliki batasan panjang atau pendaftaran, dan gratis. Model AI diunduh sekali pada penggunaan pertama (kemudian di-cache), dan GPU (WebGPU) mempercepatnya secara otomatis bila tersedia.

Pertanyaan yang Sering Diajukan

Apakah transcriber audio-ke-teks ini benar-benar gratis dan pribadi?

Ya — ini benar-benar gratis tanpa perlu mendaftar, dan bersifat pribadi: model ucapan berjalan di dalam browser Anda, sehingga file audio atau video Anda tidak pernah meninggalkan perangkat Anda dan tidak pernah diunggah ke server mana pun.

Apakah itu mengunggah file saya ke server?

Tidak. Transkripsi terjadi 100% di perangkat Anda sendiri menggunakan model AI dalam browser. Tidak ada yang dikirim ke mana pun, itulah sebabnya aman untuk rekaman sensitif seperti rapat, wawancara, atau catatan suara.

Bisakah saya mendapatkan subtitle SRT atau VTT, bukan hanya teks?

Ya. Bersama dengan transkrip teks biasa, Anda mendapatkan file subtitle SRT dan VTT berkode waktu untuk diunduh, siap untuk dimasukkan ke YouTube, Premiere Pro, DaVinci Resolve, CapCut, atau alur kerja subtitle apa pun.

Format dan bahasa audio dan video apa yang didukung?

Format paling umum berfungsi — MP3, WAV, M4A, OGG, FLAC, plus MP4 dan video lainnya (trek audio dibaca secara otomatis). Model Whisper memahami lusinan bahasa dan menyalinnya ke dalam skrip mereka sendiri.

Seberapa akurat transkripsinya?

Ia menggunakan OpenAI Whisper, salah satu model pengenalan ucapan terbuka terbaik, sehingga ucapan yang jelas ditranskripsikan dengan sangat akurat. Kebisingan latar belakang, aksen berat, atau pengeras suara yang tumpang tindih dapat menurunkan akurasi — Anda dapat dengan cepat mengedit transkrip sebelum mengekspor.

Mengapa ia mengunduh sesuatu untuk pertama kalinya?

Model ucapan AI (beberapa puluh MB) diunduh sekali pada penggunaan pertama dan kemudian disimpan dalam cache oleh browser Anda, sehingga transkripsi selanjutnya akan langsung dimulai. Perangkat dengan WebGPU menjalankannya lebih cepat.