जब भी आर्टिफिशियल इंटेलिजेंस यानी AI का जिक्र होता है, तो सबसे पहले अमेरिका की बड़ी टेक कंपनियों जैसे Google के Gemini और OpenAI के ChatGPT का नाम सामने आता है. लंबे समय तक यह माना जाता रहा कि भारत इस तकनीकी दौड़ में केवल एक यूजर की भूमिका में रहेगा. लेकिन बेंगलुरु के एक स्टार्टअप ने इस धारणा को पूरी तरह बदल दिया है. ‘Sarvam AI’ नाम की इस कंपनी ने ऐसे देसी AI टूल्स विकसित किए हैं, जो भारतीय भाषाओं और दस्तावेजों को समझने में दुनिया के दिग्गज AI मॉडल्स से भी आगे निकलते नजर आ रहे हैं.
Sarvam Vision: भारतीय दस्तावेजों का ‘एक्स-रे’
आमतौर पर देखा गया है कि ChatGPT या Gemini अंग्रेजी में तो बहुत अच्छा काम करते हैं, लेकिन जब बात भारतीय भाषाओं, हाथ से लिखे दस्तावेजों या पेचीदा सरकारी कागजों की आती है, तो ये ग्लोबल मॉडल्स अक्सर लड़खड़ा जाते हैं. यहीं पर काम आता है ‘Sarvam Vision’. यह एक OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) टूल है, जिसका काम तस्वीरों या स्कैन किए हुए कागजों से टेक्स्ट को पढ़ना है.
यह और भी चौंकाने वाली बात है कि डेटा और बेंचमार्क के स्तर पर इस टूल ने कई दिग्गज AI मॉडल्स को पीछे छोड़ दिया है. ‘olmOCR-Bench’ जैसे कठिन टेस्ट में Sarvam Vision ने 84.3% की सटीकता दर्ज की, जो Google Gemini 1.5 Pro और DeepSeek जैसे बड़े मॉडल्स से कहीं बेहतर है. गणित के जटिल फॉर्मूले हों, असमान टेबल्स हों या पेचीदा लेआउट, यह टूल हर तरह के कंटेंट को 93.28% तक की उच्च एक्यूरेसी के साथ पढ़ने में सक्षम है.
‘Bulbul’ की आवाज में दिखेगी देसी मिठास
सिर्फ पढ़ने में ही नहीं, ‘Sarvam AI’ सुनने और बोलने में भी कमाल कर रहा है. कंपनी ने अपना नया वॉइस मॉडल ‘Bulbul V3’ लॉन्च किया है. यह एक टेक्स्ट-टू-स्पीच टूल है जो लिखे हुए शब्दों को आवाज देता है. इसकी खासियत यह है कि यह किसी रोबोट की तरह नहीं, बल्कि एक इंसान की तरह स्वाभाविक और भावपूर्ण तरीके से बोलता है.
फिलहाल ‘बुलबुल’ 11 भारतीय भाषाओं में 35 से अधिक अलग-अलग आवाजों के साथ बातचीत कर सकता है. कंपनी की योजना इसे आने वाले समय में 22 भारतीय भाषाओं तक विस्तार देने की है. खास बात यह है कि जहां ‘ElevenLabs’ जैसे ग्लोबल वॉइस टूल भारतीय भाषाओं के लिए काफी महंगे साबित होते हैं, वहीं ‘बुलबुल’ न सिर्फ किफायती है बल्कि देसी लहजे और उच्चारण को भी कहीं बेहतर तरीके से समझता है.
टेक एक्सपर्ट्स हुए कायल
शुरुआत में कई टेक एक्सपर्ट्स को लगा था कि भारत में अपना अलग AI मॉडल बनाना समय की बर्बादी है, लेकिन अब वे भी अपनी गलती मान रहे हैं. मशहूर टेक कमेंटेटर डीड़ी दास ने स्वीकार किया कि उन्होंने Sarvam को कम आंका था. उन्होंने कहा कि भारतीय भाषाओं के लिए इस स्टार्टअप ने वो कर दिखाया है जिसे ग्लोबल लैब्स ने अब तक नजरअंदाज किया था. वहीं, KissanAI के फाउंडर प्रतीक देसाई का कहना है कि वे अपने काम के लिए अब ‘बुलबुल’ का ही इस्तेमाल कर रहे हैं क्योंकि यह विदेशी टूल्स के मुकाबले ज्यादा सटीक और किफायती है.
यह भी पढ़े: अंधेरा होगा दूर: जापानी बैंकों से अडानी ग्रुप की मेगा डील, 950 KM में बनेगा 6000 MW ग्रीन कॉरिडोर