Question 1

この音声からテキストへの文字起こしは本当に無料でプライベートなのでしょうか?

Accepted Answer

はい - サインアップなしで完全に無料で、設計により非公開です。音声モデルはブラウザ内で実行されるため、オーディオ ファイルやビデオ ファイルがデバイスから出たり、サーバーにアップロードされたりすることはありません。

Question 2

ファイルをサーバーにアップロードしますか?

Accepted Answer

いいえ。文字起こしは、ブラウザ内の AI モデルを使用して、100% ご自身のデバイス上で行われます。どこにも何も送信されないため、会議、インタビュー、音声メモなどの機密性の高い録音にも安全です。

Question 3

テキストだけでなく、SRT または VTT 字幕を取得できますか?

Accepted Answer

はい。プレーンテキストのトランスクリプトに加えて、タイムコード化された SRT および VTT 字幕ファイルをダウンロードして、YouTube、Premiere Pro、DaVinci Resolve、CapCut、またはその他の字幕ワークフローにすぐにドロップできるようになります。

Question 4

どのようなオーディオおよびビデオの形式と言語がサポートされていますか?

Accepted Answer

MP3、WAV、M4A、OGG、FLAC、さらに MP4 およびその他のビデオなど、ほとんどの一般的な形式が機能します (オーディオ トラックは自動的に読み取られます)。 Whisper モデルは数十の言語を理解し、それらを独自のスクリプトで転写します。

Question 5

転写はどの程度正確ですか?

Accepted Answer

最高のオープン音声認識モデルの 1 つである OpenAI Whisper を使用しているため、明瞭な音声が非常に正確に書き起こされます。背景のノイズ、強いアクセント、話者の重なりにより精度が低下する可能性があります。エクスポートする前にトランスクリプトをすばやく編集できます。

Question 6

初めて何かをダウンロードするのはなぜですか?

Accepted Answer

AI 音声モデル (数十 MB) は、最初の使用時に一度ダウンロードされ、ブラウザーによってキャッシュされるため、その後の文字起こしは即座に開始されます。 WebGPU を搭載したデバイスでは、著しく高速に実行されます。

オーディオとビデオのトランスクライバー

よくある質問