आज का डिजिटल दौर लगातार बदल रहा है और तकनीक हर रोज़ नए आयाम छू रही है। इस बीच Google ने AI की दुनिया में एक बड़ा कदम बढ़ाते हुए Gemini 2.5 Computer Use लॉन्च किया है। यह नया AI मॉडल किसी इंसान की तरह कंप्यूटर और मोबाइल एप्लिकेशन को समझकर नियंत्रित कर सकता है।
अब केवल टेक्स्ट कमांड या APIs के भरोसे काम नहीं चलेगा; यह AI स्क्रीन पर दिख रहे इंटरफेस को विज़ुअली पहचानकर अपने निर्णय लेता है और कार्य करता है, बिलकुल वैसे जैसे कोई इंसान करता।
Gemini 2.5 कैसे करता है काम
Gemini 2.5 Computer Use, Gemini 2.5 Pro की विज़ुअल समझ क्षमताओं पर आधारित है। यह AI लगातार एक लूप में चलता है। सबसे पहले यह स्क्रीनशॉट लेता है, फिर यूज़र की रिक्वेस्ट और पिछली गतिविधियों का विश्लेषण करता है और UI एक्शन्स के रूप में जवाब देता है।

इस AI में ब्राउज़र खोलना, टेक्स्ट टाइप करना, ड्रैग एंड ड्रॉप, और URL नेविगेशन जैसी 13 अलग-अलग क्रियाएं शामिल हैं। हर एक्शन के बाद नया स्क्रीनशॉट लिया जाता है और प्रक्रिया तब तक चलती रहती है जब तक कार्य पूरा नहीं हो जाता।
Google ने इस मॉडल का प्रदर्शन कई रियल-लाइफ उदाहरणों के जरिए दिखाया है। यह मॉडल कई वेबसाइट्स पर अपॉइंटमेंट मैनेज करने से लेकर डिजिटल नोट्स ऑर्गनाइज करने तक काम कर सकता है। खास बात यह है कि यह मॉडल वेब ब्राउज़र और Android मोबाइल इंटरफेस में बेहद कुशल है, जबकि डेस्कटॉप OS कंट्रोल के लिए अभी इसे पूरी तरह ऑप्टिमाइज़ नहीं किया गया है।
Claude और ChatGPT से बेहतर प्रदर्शन
Google का दावा है कि Gemini 2.5 Computer Use कई टास्क में Claude और ChatGPT से बेहतर साबित हुआ है।
- शुरुआती टेस्टर्स ने बताया कि यह मॉडल प्रतियोगी समाधानों की तुलना में लगभग 50% तेज है।
- जटिल डेटा पार्सिंग और मल्टी-स्टेप टास्क में प्रदर्शन 18% तक बेहतर पाया गया।
- Google की पेमेंट्स टीम ने इसे UI टेस्ट फिक्स करने में इस्तेमाल किया, जिसमें यह 60% फेल हुई टेस्ट रन को सफलतापूर्वक रिकवर करने में सक्षम रहा।
इसका मतलब है कि Gemini 2.5 केवल इंसानों की तरह कार्य नहीं करता, बल्कि AI मुकाबले में सबसे आगे निकल चुका है।

सुरक्षा और AI गार्डरेल्स
कंप्यूटर और मोबाइल को नियंत्रित करने वाले AI के साथ जोखिम भी जुड़े होते हैं। इसे ध्यान में रखते हुए Google ने Gemini 2.5 में सुरक्षा फीचर्स जोड़े हैं। डेवलपर्स उच्च जोखिम वाले कार्य जैसे CAPTCHA बायपास या सिस्टम सिक्योरिटी उल्लंघन को रोकने के लिए नियंत्रण सेट कर सकते हैं।
Gemini 2.5 Computer Use अब Google AI Studio और Vertex AI में प्रिव्यू के लिए उपलब्ध है। इसके साथ ही Browserbase पर इसका डेमो भी देखा जा सकता है, जिसमें यह गेम खेलने, वेबसाइट ब्राउज़ करने और रोजमर्रा के डिजिटल टास्क आसानी से कर सकता है।
Disclaimer: यह जानकारी Google की आधिकारिक घोषणाओं और मीडिया रिपोर्ट्स पर आधारित है। Gemini 2.5 Computer Use के फीचर्स और उपलब्धता समय-समय पर बदल सकते हैं। किसी भी व्यावसायिक या व्यक्तिगत उपयोग से पहले आधिकारिक स्रोत से पुष्टि अवश्य करें।
यह भी पढ़ें: Tecno Pova Slim 5G: भारत का सबसे पतला और शक्तिशाली 5G स्मार्टफोन ₹19,999 में!





