ناسخ الصوت والفيديو
قم بإسقاط ملف صوتي أو فيديو واحصل على نص دقيق بالإضافة إلى ترجمات SRT وVTT جاهزة للاستخدام - 100% في متصفحك، دون تحميل أي شيء.
MP3, WAV, M4A, MP4, MOV and more. Everything runs in your browser — your file is never uploaded.
SRT and VTT subtitle files use the AI's time-codes — drop them into YouTube, Premiere, DaVinci Resolve or CapCut. Edit the text above before downloading the .txt if needed.
يقوم هذا الناسخ بتحويل الكلام في أي ملف صوتي أو فيديو إلى نص باستخدام نموذج التعرف على الكلام القائم على الذكاء الاصطناعي (OpenAI Whisper) الذي يعمل بالكامل داخل متصفحك - بحيث لا يتم تحميل ملفك إلى خادم أبدًا ويظل خاصًا تمامًا. قم بإسقاط ملف MP3 أو WAV أو M4A أو MP4 أو ملف مشابه، وسيقوم بإرجاع نسخة نظيفة بالإضافة إلى ملفات الترجمة SRT وVTT ذات الترميز الزمني التي يمكنك استخدامها على YouTube أو Premiere أو CapCut أو أي محرر فيديو. إنه يعمل عبر عشرات اللغات، وليس له حدود للطول أو الاشتراك، وهو مجاني. يتم تنزيل نموذج الذكاء الاصطناعي مرة واحدة عند الاستخدام لأول مرة (ثم يتم تخزينه مؤقتًا)، وتقوم وحدة معالجة الرسومات (WebGPU) بتسريعه تلقائيًا عندما يكون متاحًا.
الأسئلة المتداولة
هل هذا الناسخ الصوتي إلى نص مجاني وخاص حقًا؟
نعم - إنه مجاني تمامًا بدون اشتراك، كما أنه خاص حسب التصميم: يعمل نموذج الكلام داخل متصفحك، لذلك لا يغادر ملف الصوت أو الفيديو جهازك أبدًا ولا يتم تحميله أبدًا على أي خادم.
هل يقوم بتحميل الملف الخاص بي إلى الخادم؟
لا، يتم النسخ بنسبة 100% على جهازك الخاص باستخدام نموذج الذكاء الاصطناعي الموجود في المتصفح. لا يتم إرسال أي شيء إلى أي مكان، ولهذا السبب فهو آمن للتسجيلات الحساسة مثل الاجتماعات أو المقابلات أو الملاحظات الصوتية.
هل يمكنني الحصول على ترجمات SRT أو VTT، وليس النص فقط؟
نعم. بالإضافة إلى النص العادي، يمكنك الحصول على ملفات الترجمة SRT وVTT ذات الترميز الزمني للتنزيل، وتكون جاهزة للإسقاط على YouTube أو Premiere Pro أو DaVinci Resolve أو CapCut أو أي سير عمل للترجمة.
ما هي تنسيقات الصوت والفيديو واللغات المدعومة؟
تعمل معظم التنسيقات الشائعة — MP3، وWAV، وM4A، وOGG، وFLAC، بالإضافة إلى MP4 ومقاطع الفيديو الأخرى (تتم قراءة المسار الصوتي تلقائيًا). يفهم نموذج Whisper عشرات اللغات وينسخها بنصوصها الخاصة.
ما مدى دقة النسخ؟
ويستخدم OpenAI Whisper، أحد أفضل نماذج التعرف على الكلام المفتوحة، لذلك يتم نسخ الكلام الواضح بدقة شديدة. قد تؤدي الضوضاء في الخلفية أو اللهجات الثقيلة أو مكبرات الصوت المتداخلة إلى تقليل الدقة - يمكنك تحرير النص بسرعة قبل التصدير.
لماذا يتم تنزيل شيء ما في المرة الأولى؟
يتم تنزيل نموذج الكلام المدعم بالذكاء الاصطناعي (بضع عشرات من الميغابايت) مرة واحدة عند الاستخدام لأول مرة، ثم يتم تخزينه مؤقتًا بواسطة متصفحك، بحيث تبدأ عمليات النسخ اللاحقة على الفور. يعمل الجهاز المزود بـ WebGPU بشكل أسرع بشكل ملحوظ.