DALL-E 3: AI ची नवीन आवृत्ती जी तुम्ही जे काही कल्पना करता ते तयार करते

डॅलच्या विविध प्रतिमा ई

आम्ही आधीच दुसर्या प्रसंगी बोललो होतो SLAB. या निमित्ताने त्याची तिसरी आवृत्ती समोर येते. DALL-E3 कृत्रिम बुद्धिमत्तेच्या नवीन आवृत्तीचे नाव आहे AI उघडा जे मजकूरातून प्रतिमा तयार करते. ही DALL-E ची उत्क्रांती आहे, जी जानेवारी 2021 मध्ये सादर केली गेली आणि अशा विविध संकल्पनांच्या प्रतिमा निर्माण करण्याच्या क्षमतेने जगाला चकित केले आहे. टोपी असलेल्या पेंग्विनसारखे किंवा खुर्चीच्या आकाराचा एवोकॅडो. DALL-E 3 त्‍याच्‍या पूर्ववर्तीच्‍या कार्यक्षमतेमध्‍ये आणि क्षमतांमध्ये लक्षणीय सुधारणा करते, प्रदान केलेल्या मजकूरासह अधिक वास्तववादी, तपशीलवार आणि सुसंगत प्रतिमा ऑफर करते.

तसेच, नेटिव्हली ChatGPT सह समाकलित होते, GPT-3-आधारित चॅटबॉट जो तुम्हाला कृत्रिम बुद्धिमत्तेसह चॅट करण्याची परवानगी देतो आणि आमच्या सूचनांनुसार प्रतिमा तयार करण्यास सांगू शकतो. या लेखात आम्ही तुम्हाला सांगणार आहोत DALL-E 3 कसे कार्य करते, ते DALL-E बाबत कोणती नवीन वैशिष्ट्ये आणते, ते कोणत्या प्रकारच्या प्रतिमा तयार करू शकते आणि डिझाइन आणि संप्रेषणाच्या भविष्यासाठी या तंत्रज्ञानाचा काय परिणाम होतो.

DALL-E 3 कसे कार्य करते?

अंतराळवीराची प्रतिमा

DALL-E3 हे आर्टिफिशियल इंटेलिजन्स मॉडेलवर आधारित आहे कृत्रिम तंत्रिका तंत्र, विशेषत: तथाकथित ट्रान्सफॉर्मरमध्ये, जे डेटाच्या अनुक्रमांवर प्रक्रिया करण्यास सक्षम आहेत, जसे की मजकूर किंवा प्रतिमा, आणि त्यांच्यातील संबंध शिकण्यास.

हे मॉडेल मोठ्या संख्येने मजकूर-प्रतिमा जोड्यांसह प्रशिक्षित केले गेले आहे, इंटरनेटवरून काढलेले, व्हिज्युअल संकल्पना शब्दांशी जोडणे शिकण्यासाठी. अशाप्रकारे, जेव्हा मजकूर दिला जातो, तेव्हा तो स्वतःची सर्जनशीलता आणि कल्पनाशक्ती वापरून त्याचे स्पष्टीकरण देणारी प्रतिमा तयार करण्यास सक्षम असतो.

मजकूर आणि प्रतिमा दोन्ही प्राप्त करा एकल डेटा प्रवाह म्हणून, जास्तीत जास्त 1280 टोकन बनलेले. टोकन हे स्वतंत्र शब्दसंग्रहाचे कोणतेही प्रतीक आहे; उदाहरणार्थ, वर्णमाला प्रत्येक अक्षर एक टोकन आहे. DALL-E 3 ची शब्दसंग्रह मजकूर आणि प्रतिमा दोन्हीसाठी टोकन आहेत. मजकूर बीपीई (बाइट पेअर एन्कोडिंग) सह एनकोड केलेल्या कमाल 256 टोकन्स वापरून दर्शविला जातो, आणि प्रतिमेचे 1024 टोकन एन्कोड करून दाखवले जातात. VQ-VAE (वेक्टर क्वांटाइज्ड व्हेरिएशनल ऑटोएनकोडर).

DALL-E 3 ला जास्तीत जास्त संभाव्य पद्धती वापरून प्रशिक्षित केले जाते, ज्यामध्ये सर्व टोकन एकामागून एक तयार करणे, मागील दिलेल्या प्रत्येकाची संभाव्यता वाढवणे समाविष्ट आहे. अशा प्रकारे, DALL-E 3 सुरवातीपासून प्रतिमा तयार करू शकता, किंवा अस्तित्वात असलेल्या प्रतिमेचा कोणताही भाग जोपर्यंत मजकुराशी सुसंगत आहे तोपर्यंत तळाशी उजव्या कोपऱ्यापर्यंत विस्तारलेला भाग पुन्हा निर्माण करा.

ती काय बातमी आणते?

डॅलने बनवलेला टॉवर ई

DALL-E 3 गृहीत धरते DALL-E च्या तुलनेत मोठी प्रगती अनेक पैलूंमध्ये. सर्व प्रथम, DALL-E 3 मध्ये उच्च रिझोल्यूशन आणि ते निर्माण केलेल्या प्रतिमांमध्ये गुणवत्ता आहे. DALL-E च्या प्रतिमा तयार करताना 256 × 256 पिक्सेल, DALL-E 3 च्या प्रतिमा तयार करते 512 × 512 पिक्सेल, जे तुम्हाला तपशील आणि पोत यांचे अधिक चांगले कौतुक करण्यास अनुमती देते.

दुसरे म्हणजे, DALL-E 3 मध्ये ए अधिक समज आणि अचूकता प्रदान केलेल्या मजकूराचा अर्थ लावताना. ते मजकूरातील बारकावे आणि वैशिष्ट्ये तसेच प्रतिमा बनविणाऱ्या घटकांमधील संबंध अधिक चांगल्या प्रकारे कॅप्चर करण्यास सक्षम आहे. उदाहरणार्थ, तुम्ही आतील मजकूरासह प्रतिमा तयार करू शकता, जसे की पोस्टर किंवा लेबले, मजकूराची भाषा आणि स्वरूप यांचा आदर करणे. तुम्ही हात किंवा पाय यासारख्या अधिक वास्तववादी आणि प्रमाणबद्ध मानवी शरीराच्या अवयवांसह प्रतिमा देखील तयार करू शकता.

तिसरा, DALL-E 3 अधिक एकीकरण आणि सहजता आहे ChatGPT शी जोडल्याबद्दल धन्यवाद. ChatGPT हा ओपनएआयचा GPT-3 वर आधारित चॅटबॉट आहे, जो जगातील सर्वात प्रगत भाषा मॉडेल आहे, जो तुम्हाला आर्टिफिशियल इंटेलिजेंससह चॅट करण्याची आणि गोष्टी करण्यास सांगण्याची परवानगी देतो. ChatGPT, DALL-E 3 सह एकत्रित करून आपण अधिक तपशीलवार सूचना प्राप्त करू शकता आणि प्रतिमा तयार करण्यासाठी स्पष्ट प्रतिमा, तसेच वापरकर्त्याला अधिक नैसर्गिक आणि द्रव अभिप्राय ऑफर करणे.

DALL-E 3 कोणत्या प्रकारच्या प्रतिमा तयार करू शकते?

एक dall ई पेंटिंग

DALL-E3 नैसर्गिक भाषेत व्यक्त करता येणाऱ्या विविध संकल्पनांच्या प्रतिमा तयार करू शकतात. काही उदाहरणे अशी:

  • मानवरूपी वस्तू किंवा प्राण्यांच्या प्रतिमा, म्हणजे, मानवी वैशिष्ट्यांसह. उदाहरणार्थ, सूट आणि टायमध्ये मांजर किंवा चष्मा आणि टोपीमध्ये हत्ती.
  • संकरित वस्तू किंवा प्राण्यांच्या प्रतिमा, म्हणजे, दोन किंवा अधिक प्रजातींच्या एकत्रित वैशिष्ट्यांसह. उदाहरणार्थ, फुलपाखराचे पंख असलेला कुत्रा किंवा सिंहाचे डोके असलेला साप.
  • सुधारित वस्तू किंवा प्राण्यांच्या प्रतिमा, म्हणजे, बदललेल्या किंवा जोडलेल्या वैशिष्ट्यांसह. उदाहरणार्थ, चीज चाकांसह कार किंवा काचेच्या पाकळ्या असलेले फूल.
  • काल्पनिक वस्तू किंवा प्राण्यांच्या प्रतिमा, म्हणजेच ते वास्तवात अस्तित्वात नाहीत. उदाहरणार्थ, गुलाबी युनिकॉर्न किंवा फायर ड्रॅगन.
  • काल्पनिक दृश्ये किंवा भूदृश्यांच्या प्रतिमा, म्हणजे, ते कोणत्याही वास्तविक स्थानाशी संबंधित नाहीत. उदाहरणार्थ, आकाशात तरंगणारे शहर किंवा जादूचे जंगल.
  • विद्यमान प्रतिमांचे परिवर्तन किंवा हाताळणीची प्रतिमा, म्हणजे, ते मूळ प्रतिमेचे काही पैलू बदलतात. उदाहरणार्थ, एखाद्या व्यक्तीच्या केसांचा किंवा डोळ्यांचा रंग बदलणे किंवा इमेजमधून काहीतरी जोडणे किंवा काढून टाकणे.

DALL-E 3 चे काय परिणाम आहेत?

AI मध्ये बनवलेले रंगीत सूप

DALL-E 3 हे कृत्रिम बुद्धिमत्तेच्या क्षेत्रासाठी असलेल्या प्रचंड क्षमतेचे उदाहरण आहे. डिझाइन आणि संप्रेषण. DALL-E 3 सह, वैयक्तिकृत आणि मूळ प्रतिमा तयार करण्याची शक्यता फक्त एक वाक्यांश लिहून उघडते, जे अनेक व्यावहारिक अनुप्रयोग असू शकतात आणि सर्जनशील.

उदाहरणार्थ, DALL-E 3 यासाठी वापरले जाऊ शकते:

  • पुस्तकांसाठी चित्रे तयार करा, मासिके किंवा ब्लॉग.
  • लोगो किंवा पोस्टर तयार करा ब्रँड किंवा कार्यक्रमांसाठी.
  • अवतार किंवा इमोजी तयार करा सामाजिक नेटवर्क किंवा गेमसाठी.
  • मीम्स किंवा स्टिकर्स तयार करा मित्रांसह सामायिक करण्यासाठी.
  • स्केचेस किंवा प्रोटोटाइप तयार करा कलात्मक किंवा व्यावसायिक प्रकल्पांसाठी.
  • शैक्षणिक प्रतिमा तयार करा किंवा जटिल संकल्पना स्पष्ट करण्यासाठी माहितीपूर्ण.

तथापि, DALL-E 3 मध्ये काही आव्हाने आणि धोके देखील आहेत ज्यांचा विचार केला पाहिजे. एकीकडे, DALL-E 3 कामावर परिणाम होऊ शकतो आणि मानवी डिझायनर आणि कलाकारांची ओळख, ज्यांना त्यांची सर्जनशीलता आणि मौलिकता मशीनद्वारे धोक्यात येऊ शकते. दुसरीकडे, DALL-E 3 खोट्या किंवा दिशाभूल करणारी सामग्री, जसे की डीपफेक किंवा फेक न्यूज तयार करणे आणि प्रसारित करणे सुलभ करू शकते, ज्याचे समाजासाठी नकारात्मक परिणाम होऊ शकतात.

तुमची कल्पनाशक्ती, आता अडथळ्यांशिवाय

एआय व्युत्पन्न रोबोट

DALL-E 3 ची नवीन आवृत्ती आहे OpenAI कृत्रिम बुद्धिमत्ता जे मजकूरातून प्रतिमा तयार करते. DALL-E 3 ते व्युत्पन्न करत असलेल्या प्रतिमांची गुणवत्ता आणि सुस्पष्टता सुधारते तसेच ChatGPT सह त्याचे एकत्रीकरण सुधारते. आपण विविध प्रकारच्या संकल्पनांच्या अविश्वसनीय प्रतिमा तयार करू शकता ज्या नैसर्गिक भाषेत व्यक्त केल्या जाऊ शकतात. DALL-E 3 आहे डिझाइन आणि संप्रेषणासाठी मोठी क्षमता, परंतु त्यात काही आव्हाने आणि धोके देखील आहेत ज्यांचा विचार केला पाहिजे.


आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटा जबाबदार: मिगुएल Áन्गल गॅटन
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.