Home टेक OpenAI के नए AI मॉडल टेक्स्ट से चित्र बनाते हैं, उन्हें बेहतर...

OpenAI के नए AI मॉडल टेक्स्ट से चित्र बनाते हैं, उन्हें बेहतर वर्गीकृत करते हैं

OpenAI ने DALL-E और CLIP का अनावरण किया है, दो नए जेनेरिक AI मॉडल जो आपके पाठ से चित्र उत्पन्न कर सकते हैं और आपकी छवियों को क्रमशः श्रेणियों में वर्गीकृत कर सकते हैं। DALL · E एक ऐसा न्यूरल नेटवर्क है, जो इसे खिलाए गए वाइल्डेस्ट टेक्स्ट और इमेज डिस्क्रिप्शन से इमेज तैयार कर सकता है, जैसे कि “एवोकैडो के आकार में आर्मचेयर” या “स्केच के रूप में शीर्ष पर एक ही बिल्ली” तल”। CLIP छवि वर्गीकरण के लिए प्रशिक्षण की एक नई पद्धति का उपयोग करता है, जिसका अर्थ है कि छवि प्रकारों की एक सीमा के भीतर अधिक सटीक, कुशल और लचीला होना।

अमेरिका स्थित एआई कंपनी से जेनेरिक प्री-प्रशिक्षित ट्रांसफार्मर 3 (जीपीटी -3) मॉडल छवियों और मानव जैसे पाठ बनाने के लिए गहन सीखने का उपयोग करते हैं। आप अपनी कल्पना को जंगली के रूप में चलने दे सकते हैं जैसा कि DALL · E को पाठ इनपुट के आधार पर विविध और कभी-कभी वास्तविक – छवियों को बनाने के लिए प्रशिक्षित किया जाता है। लेकिन मॉडल ने अपने स्वयं के बनाने के लिए वेब से DALL-E स्रोतों की छवियों के बाद से कॉपीराइट के मुद्दों के बारे में भी सवाल उठाए हैं।

एआई इलस्ट्रेटर DALL · E विचित्र चित्र बनाता है

DALL · E नाम, जैसा कि आप पहले ही अनुमान लगा चुके होंगे, यह एक सर्जिस्ट कलाकार सल्वाडोर डाली और का एक चित्र है पिक्सर की दीवार · ई। DALL · E quirky इमेज बनाने के लिए टेक्स्ट और इमेज इनपुट का उपयोग कर सकता है। उदाहरण के लिए, यह “एक कुत्ते के चलने वाले टूटू में एक बच्चे की डायकोन मूली का चित्रण” या “वीणा से बना घोंघा” बना सकता है। DALL · E को न केवल खरोंच से छवियां उत्पन्न करने के लिए प्रशिक्षित किया जाता है, बल्कि किसी भी मौजूदा छवि को इस तरह से पुनर्जीवित करने के लिए भी पाठ या छवि संकेत के साथ संगत किया जाता है।

पाठ के लिए छवि परिणाम ‘वीणा से बना घोंघा’

जीपीटी -Three द्वारा OpenAI एक गहरी शिक्षण भाषा मॉडल है जो भाषा इनपुट का उपयोग करके विभिन्न प्रकार के पाठ-निर्माण कार्य कर सकता है। जीपीटी -Three मानव की तरह ही कहानी लिख सकता है। DALL · E के लिए, सैन फ्रांसिस्को स्थित AI लैब ने छवियों के साथ पाठ की अदला-बदली करके एक छवि GPT-Three बनाई और AI को आधे-अधूरे चित्रों को पूरा करने के लिए प्रशिक्षित किया।

DALL · E मानव विशेषताओं के साथ जानवरों या चीजों की छवियों को आकर्षित कर सकता है और असंबंधित वस्तुओं को एक छवि बनाने के लिए समझदारी से जोड़ सकता है। छवियों की सफलता दर इस बात पर निर्भर करेगी कि पाठ कितना अच्छा है। DALL · E अक्सर “रिक्त स्थान को भरने” में सक्षम होता है जब कैप्शन का अर्थ है कि छवि में एक निश्चित विवरण होना चाहिए जो स्पष्ट रूप से नहीं बताया गया है। उदाहरण के लिए, पाठ ‘कछुए से बना जिराफ’ या ‘एवाकाडो के आकार में एक कुर्सी’ आपको एक संतोषजनक आउटपुट देगा।

पाठ और छवियों को एक साथ जोड़ना

CLIP (कॉन्ट्रास्टिव लैंग्वेज-इमेज प्री-ट्रेनिंग) एक न्यूरल नेटवर्क है जो प्राकृतिक भाषा के आधार पर सटीक इमेज वर्गीकरण कर सकता है। यह “अनफ़िल्टर्ड, अत्यधिक विविध और अत्यधिक शोर डेटा” से अलग-अलग श्रेणियों में छवियों को अधिक सटीक और कुशलतापूर्वक वर्गीकृत करने में मदद करता है। सीएलआईपी अलग बनाता है कि यह क्यूरेट डेटा सेट से छवियों को नहीं पहचानता है, क्योंकि दृश्य वर्गीकरण के लिए अधिकांश मौजूदा मॉडल हैं। सीएलआईपी को प्राकृतिक भाषा पर्यवेक्षण की एक विस्तृत विविधता पर प्रशिक्षित किया गया है जो इंटरनेट पर उपलब्ध है। इस प्रकार, CLIP सीखता है कि एक डेटा सेट से एक लेबल एकल शब्द के बजाय एक विस्तृत विवरण से एक तस्वीर में क्या है।

सीएलआईपी को किसी भी दृश्य वर्गीकरण बेंचमार्क पर लागू किया जा सकता है ताकि दृश्य श्रेणियों के नाम को मान्यता प्रदान की जा सके। के मुताबिक OpenAI ब्लॉग, CLIP GPT-2 और GPT-Three की “शून्य-शॉट” क्षमताओं के समान है।

DALL · E और CLIP जैसे मॉडल महत्वपूर्ण सामाजिक प्रभाव की क्षमता रखते हैं। ओपनएआई टीम का कहना है कि वे विश्लेषण करेंगे कि ये मॉडल कुछ व्यवसायों पर आर्थिक प्रभाव, मॉडल आउटपुट में पूर्वाग्रह की क्षमता और इस तकनीक द्वारा निहित दीर्घकालीन नैतिक चुनौतियों से संबंधित सामाजिक मुद्दों से कैसे संबंधित हैं।

एक सामान्य एआई मॉडल जैसे DALL · E जो इंटरनेट से सीधे चित्र चुनता है, कई कॉपीराइट उल्लंघन का मार्ग प्रशस्त कर सकता है। DALL · E इंटरनेट पर किसी मौजूदा छवि के किसी भी आयताकार क्षेत्र को फिर से बना सकता है। और लोग विकृत छवियों के अटेंशन और कॉपीराइट के बारे में ट्वीट करते रहे हैं।


2021 का सबसे रोमांचक टेक लॉन्च क्या होगा? हमने इस पर चर्चा की कक्षा का, हमारे साप्ताहिक प्रौद्योगिकी पॉडकास्ट, जिसे आप के माध्यम से सदस्यता ले सकते हैं Apple पॉडकास्ट, Google पॉडकास्ट, या आरएसएस, एपिसोड डाउनलोड करें, या बस नीचे दिए गए प्ले बटन को हिट करें।



Supply by [author_name]

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments