AI रेस में भारत का धमाका! ‘Vision’ और ‘Bulbul’ ने Google–ChatGPT को छोड़ा पीछे

Shivam
Reporter The Printlines (Part of Bharat Express News Network)

जब भी आर्टिफिशियल इंटेलिजेंस यानी AI का जिक्र होता है, तो सबसे पहले अमेरिका की बड़ी टेक कंपनियों जैसे Google के Gemini और OpenAI के ChatGPT का नाम सामने आता है. लंबे समय तक यह माना जाता रहा कि भारत इस तकनीकी दौड़ में केवल एक यूजर की भूमिका में रहेगा. लेकिन बेंगलुरु के एक स्टार्टअप ने इस धारणा को पूरी तरह बदल दिया है. ‘Sarvam AI’ नाम की इस कंपनी ने ऐसे देसी AI टूल्स विकसित किए हैं, जो भारतीय भाषाओं और दस्तावेजों को समझने में दुनिया के दिग्गज AI मॉडल्स से भी आगे निकलते नजर आ रहे हैं.

Sarvam Vision: भारतीय दस्तावेजों का ‘एक्स-रे’

आमतौर पर देखा गया है कि ChatGPT या Gemini अंग्रेजी में तो बहुत अच्छा काम करते हैं, लेकिन जब बात भारतीय भाषाओं, हाथ से लिखे दस्तावेजों या पेचीदा सरकारी कागजों की आती है, तो ये ग्लोबल मॉडल्स अक्सर लड़खड़ा जाते हैं. यहीं पर काम आता है ‘Sarvam Vision’. यह एक OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) टूल है, जिसका काम तस्वीरों या स्कैन किए हुए कागजों से टेक्स्ट को पढ़ना है.

यह और भी चौंकाने वाली बात है कि डेटा और बेंचमार्क के स्तर पर इस टूल ने कई दिग्गज AI मॉडल्स को पीछे छोड़ दिया है. ‘olmOCR-Bench’ जैसे कठिन टेस्ट में Sarvam Vision ने 84.3% की सटीकता दर्ज की, जो Google Gemini 1.5 Pro और DeepSeek जैसे बड़े मॉडल्स से कहीं बेहतर है. गणित के जटिल फॉर्मूले हों, असमान टेबल्स हों या पेचीदा लेआउट, यह टूल हर तरह के कंटेंट को 93.28% तक की उच्च एक्यूरेसी के साथ पढ़ने में सक्षम है.

‘Bulbul’ की आवाज में दिखेगी देसी मिठास

सिर्फ पढ़ने में ही नहीं, ‘Sarvam AI’ सुनने और बोलने में भी कमाल कर रहा है. कंपनी ने अपना नया वॉइस मॉडल ‘Bulbul V3’ लॉन्च किया है. यह एक टेक्स्ट-टू-स्पीच टूल है जो लिखे हुए शब्दों को आवाज देता है. इसकी खासियत यह है कि यह किसी रोबोट की तरह नहीं, बल्कि एक इंसान की तरह स्वाभाविक और भावपूर्ण तरीके से बोलता है.

फिलहाल ‘बुलबुल’ 11 भारतीय भाषाओं में 35 से अधिक अलग-अलग आवाजों के साथ बातचीत कर सकता है. कंपनी की योजना इसे आने वाले समय में 22 भारतीय भाषाओं तक विस्तार देने की है. खास बात यह है कि जहां ‘ElevenLabs’ जैसे ग्लोबल वॉइस टूल भारतीय भाषाओं के लिए काफी महंगे साबित होते हैं, वहीं ‘बुलबुल’ न सिर्फ किफायती है बल्कि देसी लहजे और उच्चारण को भी कहीं बेहतर तरीके से समझता है.

टेक एक्सपर्ट्स हुए कायल

शुरुआत में कई टेक एक्सपर्ट्स को लगा था कि भारत में अपना अलग AI मॉडल बनाना समय की बर्बादी है, लेकिन अब वे भी अपनी गलती मान रहे हैं. मशहूर टेक कमेंटेटर डीड़ी दास ने स्वीकार किया कि उन्होंने Sarvam को कम आंका था. उन्होंने कहा कि भारतीय भाषाओं के लिए इस स्टार्टअप ने वो कर दिखाया है जिसे ग्लोबल लैब्स ने अब तक नजरअंदाज किया था. वहीं, KissanAI के फाउंडर प्रतीक देसाई का कहना है कि वे अपने काम के लिए अब ‘बुलबुल’ का ही इस्तेमाल कर रहे हैं क्योंकि यह विदेशी टूल्स के मुकाबले ज्यादा सटीक और किफायती है.

यह भी पढ़े: अंधेरा होगा दूर: जापानी बैंकों से अडानी ग्रुप की मेगा डील, 950 KM में बनेगा 6000 MW ग्रीन कॉरिडोर

Latest News

भारत ने सेशेल्स के लिए खोला खजाना, 175 मिलियन डॉलर के आर्थिक पैकेज का किया ऐलान

India Seychelles relations: भारत के प्रधानमंत्री नरेंद्र मोदी और सेशेल्स के राष्ट्रपति डॉ. पैट्रिक हर्मिनी के बीच सोमवार को...

More Articles Like This

Exit mobile version