Question 1

这个音频到文本转录器真的免费且私密吗？

Accepted Answer

是的 - 它完全免费，无需注册，并且设计上是私密的：语音模型在您的浏览器内运行，因此您的音频或视频文件永远不会离开您的设备，也永远不会上传到任何服务器。

Question 2

它将我的文件上传到服务器吗？

Accepted Answer

不会。转录 100% 使用浏览器内的 AI 模型在您自己的设备上进行。任何内容都不会发送到任何地方，这就是为什么它对于会议、采访或语音笔记等敏感录音是安全的。

Question 3

我可以获得 SRT 或 VTT 字幕，而不仅仅是文本吗？

Accepted Answer

是的。除了纯文本脚本之外，您还可以下载时间编码的 SRT 和 VTT 字幕文件，准备好放入 YouTube、Premiere Pro、DaVinci Resolve、CapCut 或任何字幕工作流程中。

Question 4

支持哪些音频和视频格式和语言？

Accepted Answer

最常见的格式均可使用 - MP3、WAV、M4A、OGG、FLAC，以及 MP4 和其他视频（自动读取音轨）。 Whisper 模型可以理解数十种语言，并将它们转录成自己的脚本。

Question 5

转录的准确性如何？

Accepted Answer

它使用 OpenAI Whisper，这是最好的开放式语音识别模型之一，因此清晰的语音转录非常准确。背景噪音、重口音或重叠的说话者可能会降低准确性 - 您可以在导出之前快速编辑文字记录。

Question 6

为什么第一次会下载东西？

Accepted Answer

AI 语音模型（几十 MB）在首次使用时下载一次，然后由浏览器缓存，以便以后立即开始转录。具有 WebGPU 的设备运行速度明显更快。

音频和视频转录器

常见问题解答