DALL-E 3: AI uus versioon, mis loob kõike, mida ette kujutate

Erinevaid pilte dall e

Me olime sellest juba ühel teisel korral rääkinud DALL-E. Sel korral ilmub selle kolmas versioon. DALL-E3 on tehisintellekti uue versiooni nimi OpenAI mis loob tekstist pilte. See on DALL-E edasiarendus, mida esitleti 2021. aasta jaanuaris ja mis on juba üllatanud maailma oma võimega luua pilte nii mitmekesistest kontseptsioonidest. nagu mütsiga pingviin või toolikujuline avokaado. DALL-E 3 parandab märkimisväärselt oma eelkäija jõudlust ja võimalusi, pakkudes esitatud tekstiga realistlikumaid, üksikasjalikumaid ja järjekindlamaid pilte.

Lisaks integreerub algselt ChatGPT-ga, GPT-3-l põhinev vestlusbot, mis võimaldab teil tehisintellektiga vestelda ja paluda tal meie juhiste järgi pilte luua. Selles artiklis me ütleme teile kuidas DALL-E 3 töötab, milliseid uusi funktsioone see DALL-E-ga seoses toob, milliseid kujutisi see saab luua ja milline on selle tehnoloogia mõju disaini ja kommunikatsiooni tulevikule.

Kuidas DALL-E 3 töötab?

Dall ja astronaudi pilt

DALL-E3 See on tehisintellekti mudel, mis põhineb kunstlikud närvivõrgud, täpsemalt nn trafodes, mis on võimelised töötlema andmejadasid, näiteks teksti või pilte, ja õppima nendevahelisi seoseid.

See mudel on koolitatud suure hulga teksti-pildi paaridega, mis on välja võetud Internetist, et õppida seostama visuaalseid mõisteid sõnadega. Nii suudab ta teksti saades genereerida seda illustreeriva pildi, kasutades selleks enda loovust ja kujutlusvõimet.

Saate vastu nii teksti kui ka pildi ühe andmevoona, mis koosneb maksimaalselt 1280 märgist. Märk on mis tahes diskreetse sõnavara sümbol; Näiteks iga tähestiku täht on märk. DALL-E 3 sõnavara on märgid nii teksti kui ka pildi jaoks. Tekst on esitatud maksimaalselt 256 BPE-ga (baidipaari kodeeringuga) kodeeritud märgiga ja pilt on esitatud 1024 märgiga, mis on kodeeritud VQ-VAE (Vector Quantized Variational Autoencoder).

DALL-E 3 treenitakse maksimaalse tõenäosuse meetodil, mis seisneb kõigi žetoonide genereerimises üksteise järel, maksimeerides iga eelneva tõenäosuse. Sel viisil DALL-E 3 saab luua pildi nullistvõi taastage olemasoleva pildi mis tahes osa, mis ulatub paremasse alanurka, kui see on tekstiga kooskõlas.

Mis uudiseid see toob?

Torn, mille on valmistanud Dall e

DALL-E 3 eeldab suur edasiminek võrreldes DALL-E-ga mitmes aspektis. Esiteks on DALL-E 3 piltide eraldusvõime ja kvaliteet kõrgem. Samal ajal kui DALL-E lõi pilte 256 × 256 pikslit, DALL-E 3 loob pilte 512 × 512 pikslit, mis võimaldab paremini hinnata detaile ja tekstuure.

Teiseks on DALL-E 3-l a suurem mõistmine ja täpsus esitatud teksti tõlgendamisel. See suudab paremini tabada teksti nüansse ja spetsifikatsioone, samuti pildi moodustavate elementide vahelisi suhteid. Näiteks, saate luua pilte, mille sees on tekst, nagu plakatid või sildid, austades teksti keelt ja vormingut. Samuti saate luua pilte realistlikumate ja proportsionaalsemate inimese kehaosadega, nagu käed või jalad.

Kolmandaks, DALL-E 3 on suurem integreeritus ja lihtsus tänu ühendusele ChatGPT-ga. ChatGPT on OpenAI vestlusbot, mis põhineb GPT-3-l, maailma kõige arenenumal keelemudelil, mis võimaldab vestelda tehisintellektiga ja paluda tal asju teha. Integreerides ChatGPT-ga, DALL-E 3 saate täpsemaid juhiseid ja selged pildid piltide loomiseks ning kasutajale loomulikuma ja sujuvama tagasiside pakkumine.

Milliseid pilte saab DALL-E 3 luua?

Naljakas maal

DALL-E3 suudab luua kujundeid väga erinevatest mõistetest, mida saab väljendada loomulikus keeles. Mõned näited on järgmised:

  • Antropomorfiseeritud objektide või loomade kujutisedst inimlike omadustega. Näiteks ülikonna ja lipsuga kass või prillide ja mütsiga elevant.
  • Hübriidsete objektide või loomade kujutisedst kahe või enama liigi kombineeritud omadustega. Näiteks liblika tiibadega koer või lõvi peaga madu.
  • Muudetud objektide või loomade kujutisedst muudetud või lisatud omadustega. Näiteks juusturatastega auto või klaasist kroonlehtedega lill.
  • kujuteldavate objektide või loomade kujutised, ehk neid tegelikkuses ei eksisteeri. Näiteks roosa ükssarvik või tuledraakon.
  • Kujutised väljamõeldud stseenidest või maastikestst need ei vasta ühelegi päriskohale. Näiteks taevas hõljuv linn või nõiutud mets.
  • Pildid olemasolevate piltide teisendustest või manipulatsioonidest, see tähendab, et need muudavad esialgse pildi mõnda aspekti. Näiteks inimese juuste või silmade värvi muutmine või pildile millegi lisamine või eemaldamine.

Millised on DALL-E 3 tagajärjed?

Tehisintellektiga valmistatud värviline supp

DALL-E 3 on näide tohutust potentsiaalist, mis tehisintellektil selles valdkonnas on disain ja kommunikatsioon. DALL-E 3 abil avaneb võimalus luua isikupärastatud ja originaalseid pilte, kirjutades lihtsalt fraasi, mis võib olla mitu praktilist rakendust ja loominguline.

Näiteks DALL-E 3 saab kasutada:

  • Looge raamatutele illustratsioone, ajakirjad või ajaveebid.
  • Looge logosid või plakateid kaubamärkide või sündmuste jaoks.
  • Looge avatare või emotikone sotsiaalvõrgustike või mängude jaoks.
  • Looge meeme või kleebiseid sõpradega jagada.
  • Looge visandeid või prototüüpe kunstiliste või professionaalsete projektide jaoks.
  • Looge harivaid pilte või informatiivne keerukate mõistete selgitamiseks.

Siiski tekitab DALL-E 3 ka mõningaid väljakutseid ja riske, millega tuleb arvestada. Ühest küljest DALL-E 3 võib mõjutada tööd ning inimestest disainerite ja kunstnike tunnustus, kes nägid oma loovust ja originaalsust ohustamas masinaga. Teisest küljest võib DALL-E 3 hõlbustada vale või eksitava sisu loomist ja levitamist, nagu sügavad võltsingud või võltsuudised, millel võivad olla ühiskonnale negatiivsed tagajärjed.

Teie kujutlusvõime, nüüd ilma takistusteta

AI loodud robot

DALL-E 3 on selle uus versioon OpenAI tehisintellekt mis loob tekstist pilte. DALL-E 3 parandab genereeritavate piltide kvaliteeti ja täpsust, samuti selle integreerimist ChatGPT-ga. Saate luua uskumatuid pilte paljudest mõistetest, mida saab väljendada loomulikus keeles. DALL-E 3-l on suur disaini- ja suhtluspotentsiaal, kuid sellega kaasnevad ka mõned väljakutsed ja riskid, millega tuleb arvestada.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutab: Miguel Ángel Gatón
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.