音频和视频转录器
放入音频或视频文件,即可获得准确的文字记录以及现成的 SRT 和 VTT 字幕 — 100% 在浏览器中完成,无需上传任何内容。
MP3, WAV, M4A, MP4, MOV and more. Everything runs in your browser — your file is never uploaded.
SRT and VTT subtitle files use the AI's time-codes — drop them into YouTube, Premiere, DaVinci Resolve or CapCut. Edit the text above before downloading the .txt if needed.
该转录器使用完全在浏览器内运行的 AI 语音识别模型 (OpenAI Whisper) 将任何音频或视频文件中的语音转换为文本,因此您的文件永远不会上传到服务器并保持完全私密。放入 MP3、WAV、M4A、MP4 或类似文件,它会返回干净的脚本以及时间编码的 SRT 和 VTT 字幕文件,您可以在 YouTube、Premiere、CapCut 或任何视频编辑器上使用。它适用于数十种语言,没有长度限制或注册,并且是免费的。 AI 模型在首次使用时下载一次(然后进行缓存),并且 GPU (WebGPU) 在可用时自动加速。
常见问题解答
这个音频到文本转录器真的免费且私密吗?
是的 - 它完全免费,无需注册,并且设计上是私密的:语音模型在您的浏览器内运行,因此您的音频或视频文件永远不会离开您的设备,也永远不会上传到任何服务器。
它将我的文件上传到服务器吗?
不会。转录 100% 使用浏览器内的 AI 模型在您自己的设备上进行。任何内容都不会发送到任何地方,这就是为什么它对于会议、采访或语音笔记等敏感录音是安全的。
我可以获得 SRT 或 VTT 字幕,而不仅仅是文本吗?
是的。除了纯文本脚本之外,您还可以下载时间编码的 SRT 和 VTT 字幕文件,准备好放入 YouTube、Premiere Pro、DaVinci Resolve、CapCut 或任何字幕工作流程中。
支持哪些音频和视频格式和语言?
最常见的格式均可使用 - MP3、WAV、M4A、OGG、FLAC,以及 MP4 和其他视频(自动读取音轨)。 Whisper 模型可以理解数十种语言,并将它们转录成自己的脚本。
转录的准确性如何?
它使用 OpenAI Whisper,这是最好的开放式语音识别模型之一,因此清晰的语音转录非常准确。背景噪音、重口音或重叠的说话者可能会降低准确性 - 您可以在导出之前快速编辑文字记录。
为什么第一次会下载东西?
AI 语音模型(几十 MB)在首次使用时下载一次,然后由浏览器缓存,以便以后立即开始转录。具有 WebGPU 的设备运行速度明显更快。