Google Releases Imagen 3 AI Image Generation Model to Users, Adds Improved Capabilities

गूगल ने गुरुवार को इमेज जेनरेशन के लिए अपना इन-हाउस आर्टिफिशियल इंटेलिजेंस (AI) मॉडल, इमेजन 3 जारी किया। तकनीकी दिग्गज ने रिलीज़ के लिए कोई घोषणा नहीं की, और इसके बजाय मॉडल को चुपचाप उपयोगकर्ताओं के लिए जारी कर दिया। इसके अतिरिक्त, इमेज जेनरेशन मॉडल के कामकाज का विवरण देने वाला एक शोध पत्र भी एक ऑनलाइन जर्नल में प्रकाशित हुआ। वर्तमान में, टेक्स्ट-टू-इमेज जेनरेशन मॉडल केवल यूएस में उपयोगकर्ताओं के लिए उपलब्ध है, और इस बारे में कोई जानकारी नहीं है कि इसे अन्य क्षेत्रों में उपयोगकर्ताओं के लिए कब रोल आउट किया जा सकता है।

गूगल द्वारा इमेजन 3 एआई मॉडल जारी किया गया

टेक दिग्गज की एआई टेस्ट किचन अब उपयोगकर्ताओं को प्लेटफ़ॉर्म पर साइन अप करने और एआई मॉडल का उपयोग करके चित्र बनाने की अनुमति दे रही है। कहा जाता है कि इसके इमेजन मॉडल की तीसरी पीढ़ी में बेहतर बनावट निर्माण और शब्द पहचान क्षमताओं के साथ-साथ सख्त संकेत अनुपालन भी शामिल है।

चूंकि AI मॉडल केवल अमेरिका में उपलब्ध है, इसलिए गैजेट्स 360 प्लेटफ़ॉर्म का परीक्षण करने में सक्षम नहीं था। हालाँकि, एक Reddit उपयोगकर्ता ने दावा किया कि वह Nikon DSLR क्वालिटी, GoPro स्टाइल, वाइड एंगल लेंस और बहुत कुछ जैसी विभिन्न शैलियों में चित्र बनाने में सक्षम था। हालाँकि, कहा जाता है कि मॉडल कई लोगों के साथ क्लोज़-अप इमेज और अंडरलाइट इमेज बनाने में संघर्ष कर रहा है जो इसके पूर्ववर्ती के साथ संभव था।

एक और क्षेत्र जहां इमेजन 3 संघर्ष करता है वह है अंग। उपयोगकर्ता ने दावा किया कि मॉडल “कॉफी का कप पकड़े हुए एक आदमी” जैसे संकेतों का उपयोग करते समय गलत परिणाम दे रहा था। एआई अतिरिक्त अंग उत्पन्न करेगा, वस्तु को पकड़े हुए एक यादृच्छिक अंग बनाएगा, या वस्तु और अंग को जोड़ देगा। छवि निर्माण मॉडल के बारे में यह भी कहा जाता है कि इसमें संकेतों में बहुत सख्त सेंसरशिप है।

गूगल ने प्री-प्रिंट ऑनलाइन जर्नल arXiv में एक शोध पत्र भी प्रकाशित किया। वहां, कंपनी ने इस बात पर प्रकाश डाला कि उसने एक लेटेंट डिफ्यूजन मॉडल का उपयोग किया है, जो स्टेबल डिफ्यूजन द्वारा लोकप्रिय किए गए डिफ्यूजन मॉडल का एक प्रकार है। कंपनी ने यह भी कहा कि इमेजन 3 मॉडल का उपयोग करके संभावित नुकसान को कम करने के लिए नए तरीकों का इस्तेमाल किया गया है।

विशेष रूप से, जेमिनी चैटबॉट का मुफ़्त टियर भी छवियाँ उत्पन्न कर सकता है, लेकिन इसके लिए यह जेमिनी की क्षमताओं का उपयोग करता है। इमेजन 3 एक अलग आर्किटेक्चर पर बनाया गया है और चूँकि इसके डेटासेट में बड़े पैमाने पर छवियाँ हैं, इसलिए यह AI छवियाँ उत्पन्न करने के लिए बेहतर प्रशिक्षित है।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।

हुआवेई का ट्राई-फोल्ड स्मार्टफोन कथित तौर पर फिर से देखा गया, इसका अनोखा डिज़ाइन दिखा


आईएमएफ का कहना है कि क्रिप्टो उद्योग का कार्बन फुटप्रिंट बढ़ रहा है; अधिकारी उत्सर्जन को रोकने के लिए कर बढ़ाने पर विचार कर रहे हैं

Google Releases Imagen 3 AI Image Generation Model to Users, Adds Improved Capabilities

Leave a Comment