Voiced
Linux के लिए एक डिक्टेशन ऐप, जिसे ख़ुद उसका इस्तेमाल करने वाले ने बनाया है।
Show the engineeringHide the engineering
प्लगेबल ASR इंजन, मूल्यांकन-संचालित विकास और AI टेक्स्ट पॉलिशिंग वाला वॉइस राइटिंग सहायक। लोकल-फर्स्ट प्रोसेसिंग के साथ Wayland के लिए निर्मित।
Built with
- Python
- Whisper
- Wayland
- DBus
- ASR Engines
Live Preview
अनुभव Voiced
केस स्टडी
इसके पीछे की सोच Voiced
समस्या
Linux में एक विश्वसनीय, उच्च-गुणवत्ता डिक्टेशन टूल की कमी है। मौजूदा समाधान Windows/Mac-केंद्रित हैं, एकल ASR इंजन से कसकर जुड़े हैं, और ट्रांसक्रिप्शन गुणवत्ता का व्यवस्थित रूप से मूल्यांकन करने का कोई तरीका नहीं है।
समाधान
कई ASR इंजन एडेप्टर (Whisper, Deepgram, आदि), मूल्यांकन-प्रथम विकास पाइपलाइन, और फॉलबैक रणनीतियों के साथ Wayland-नेटिव टेक्स्ट इंसर्शन वाला प्लगेबल आर्किटेक्चर बनाया।
प्रभाव
मूल्यांकन-प्रथम दृष्टिकोण ने अंतर्ज्ञान-संचालित विकास की तुलना में गुणवत्ता समस्याओं को 3 गुना तेज़ी से उजागर किया। सामान्य एडेप्टर इंटरफ़ेस के माध्यम से कई ASR बैकएंड का समर्थन करता है।
