ऑडियो एवं वीडियो प्रतिलेखक
एक ऑडियो या वीडियो फ़ाइल डालें और एक सटीक प्रतिलेख और उपयोग के लिए तैयार एसआरटी और वीटीटी उपशीर्षक प्राप्त करें - अपने ब्राउज़र में 100%, बिना कुछ भी अपलोड किए।
MP3, WAV, M4A, MP4, MOV and more. Everything runs in your browser — your file is never uploaded.
SRT and VTT subtitle files use the AI's time-codes — drop them into YouTube, Premiere, DaVinci Resolve or CapCut. Edit the text above before downloading the .txt if needed.
यह ट्रांसक्राइबर एआई स्पीच-रिकग्निशन मॉडल (ओपनएआई व्हिस्पर) का उपयोग करके किसी भी ऑडियो या वीडियो फ़ाइल में भाषण को टेक्स्ट में बदल देता है जो पूरी तरह से आपके ब्राउज़र के अंदर चलता है - इसलिए आपकी फ़ाइल कभी भी सर्वर पर अपलोड नहीं होती है और पूरी तरह से निजी रहती है। एक MP3, WAV, M4A, MP4 या इसी तरह की फ़ाइल डालें, और यह एक साफ़ प्रतिलेख और समय-कोडित SRT और VTT उपशीर्षक फ़ाइलें लौटाता है जिन्हें आप YouTube, Premiere, CapCut या किसी भी वीडियो संपादक पर उपयोग कर सकते हैं। यह दर्जनों भाषाओं में काम करता है, इसकी कोई लंबाई सीमा या साइनअप नहीं है, और यह मुफ़्त है। एआई मॉडल पहले उपयोग पर एक बार डाउनलोड होता है (फिर इसे कैश किया जाता है), और एक जीपीयू (वेबजीपीयू) उपलब्ध होने पर इसे स्वचालित रूप से गति देता है।
अक्सर पूछे जाने वाले प्रश्नों
क्या यह ऑडियो-टू-टेक्स्ट ट्रांसक्राइबर वास्तव में मुफ़्त और निजी है?
हां - यह बिना किसी साइनअप के पूरी तरह से मुफ़्त है, और यह डिज़ाइन द्वारा निजी है: भाषण मॉडल आपके ब्राउज़र के अंदर चलता है, इसलिए आपकी ऑडियो या वीडियो फ़ाइल कभी भी आपके डिवाइस को नहीं छोड़ती है और कभी भी किसी सर्वर पर अपलोड नहीं की जाती है।
क्या यह मेरी फ़ाइल को सर्वर पर अपलोड करता है?
नहीं, ट्रांसक्रिप्शन इन-ब्राउज़र एआई मॉडल का उपयोग करके आपके अपने डिवाइस पर 100% होता है। कुछ भी कहीं नहीं भेजा जाता है, यही कारण है कि यह बैठकों, साक्षात्कारों या वॉयस नोट्स जैसी संवेदनशील रिकॉर्डिंग के लिए सुरक्षित है।
क्या मुझे केवल पाठ ही नहीं बल्कि एसआरटी या वीटीटी उपशीर्षक भी मिल सकते हैं?
हाँ। सादे-पाठ प्रतिलेख के साथ आपको डाउनलोड करने के लिए समय-कोडित एसआरटी और वीटीटी उपशीर्षक फ़ाइलें मिलती हैं, जो यूट्यूब, प्रीमियर प्रो, डेविंसी रिजॉल्व, कैपकट या किसी उपशीर्षक वर्कफ़्लो में डालने के लिए तैयार हैं।
कौन से ऑडियो और वीडियो प्रारूप और भाषाएँ समर्थित हैं?
अधिकांश सामान्य प्रारूप काम करते हैं - MP3, WAV, M4A, OGG, FLAC, प्लस MP4 और अन्य वीडियो (ऑडियो ट्रैक स्वचालित रूप से पढ़ा जाता है)। व्हिस्पर मॉडल दर्जनों भाषाओं को समझता है और उन्हें अपनी लिपि में लिपिबद्ध करता है।
प्रतिलेखन कितना सटीक है?
यह ओपनएआई व्हिस्पर का उपयोग करता है, जो सबसे अच्छे ओपन स्पीच-रिकग्निशन मॉडल में से एक है, इसलिए स्पष्ट भाषण बहुत सटीक रूप से ट्रांसक्राइब होता है। पृष्ठभूमि शोर, भारी उच्चारण या ओवरलैपिंग स्पीकर सटीकता को कम कर सकते हैं - आप निर्यात करने से पहले प्रतिलेख को तुरंत संपादित कर सकते हैं।
यह पहली बार में कुछ क्यों डाउनलोड करता है?
एआई स्पीच मॉडल (कुछ दसियों एमबी) पहले उपयोग पर एक बार डाउनलोड होता है और फिर आपके ब्राउज़र द्वारा कैश किया जाता है, इसलिए बाद में ट्रांसक्रिप्शन तुरंत शुरू हो जाता है। WebGPU वाला एक उपकरण इसे काफ़ी तेज़ी से चलाता है।