Шта је ДАЛЛ·Е 2? Објашњење за почетнике са примерима

Cto Takoe Dall E 2 Ob Asnenie Dla Nacinausih S Primerami



Шта је ДАЛЛ·Е 2?

ДАЛЛ·Е 2 је програм вештачке интелигенције који креира слике из текстуалних описа, открио је у четвртак ОпенАИ, истраживачка компанија.





Користи верзију модела трансформатора ГПТ-3 са 12 милијарди параметара за тумачење уноса природног језика и генерисање одговарајућих слика. На пример, када се добије реченица „црно-бела фотографија малог пса“, произвела је правилно приказану црно-белу слику чиваве.





Систем није савршен — понекад производи слике које је тешко протумачити или потпуно неисправне. На пример, када је затражено да створи слику „особе која се вози моноциклом на конопцу изнад вулкана“, произвела је (прелепу, по мом мишљењу), али потпуно неповезану слику заласка сунца изнад воде са малом фигуром у првом плану .





Ипак, резултати су импресивни, а ОпенАИ каже да је ДАЛЛ·Е 2 'први АИ модел који генерише слике из текстуалних описа који могу да парирају квалитету професионалних људских уметника.'



Систем је обучен на скупу података парова текст-слика, који се састоји од око 1,3 милиона слика и натписа са Интернета које је сакупио и курирао ОпенАИ. Подаци о обуци су затим коришћени за фино подешавање ГПТ-3 модела тако да може да генерише слике из текстуалних описа.

ОпенАИ каже да систем може да генерише 'висококвалитетне' слике из широког спектра текстуалних описа, укључујући оне који су апстрактни, конкретни или чак поетски.

Поред примера чиваве, други примери слика које је произвео ДАЛЛ·Е 2 укључују правилно приказан портрет Адолфа Хитлера, слику змаја направљеног од поврћа и слику Мона Лизе направљену од тоста.



Систем је такође у стању да генерише слике ствари које не постоје, као што је 'флооф' (измишљена животиња) или 'тулпа' (мисаона форма).

Све у свему, резултати су импресивни, а ОпенАИ каже да систем „отвара нове могућности за генерисање слика из текстуалних описа.“

ИЗ Е 2 Ово ЦЛИП-систем претвара текстуалне информације у визуелне информације. Ово је парадигма кодер-декодер, што значи да када се обезбеди улазни текст, он се прво конвертује у машински унос, затим га систем обрађује и на крају прослеђује декодеру, који конвертује кодиране податке у слику.

Шта је ДАЛЛ Е 2

Шта је ДАЛЛ·Е 2?

Ово је најновија генерација ДАЛЛ·Е, генеративног модела језика који користи фразе за креирање потпуно нових визуелних ефеката. ДАЛЛ Е 2 је огроман модел од 3,5 В, иако није тако масиван као ГПТ-3. Занимљиво је да је такође лакши од свог претходника (12Б). У погледу усклађености описа и фотореализма, ДАЛЛ·Е 2 је 70% бољи од ДАЛЛ·Е 2 упркос својој већој величини.

ДАЛЛ.Е 2- објашњење за почетнике са примерима

Конкретно, ДАЛЛ·Е 2 је хијерархијски условни модел синтезе слике текста који комбинује дубоко учење за обраду природног језика са компјутерским видом за генерисање слика. Његов циљ је да обучи два модела, а сет за обуку се састоји од упарених слика и описа. Први је а приори који, ако му је дат писани наслов, може бити обучен за генерисање уграђене ЦЛИП слике. Затим имамо декодер који, када уграђује ЦЛИП слику (и натпис, ако постоји), може да генерише обучену слику.

ДАЛЛЕ 2 је обучен користећи стотине милиона фотографија са натписима са интернета, а неке од тих слика се уклањају и мењају како би се променило оно што модел учи. Он преузима више опција слике ЦЛИП прилози а затим га искористи декодер проћи кроз сваки од њих. Затим ствара занимљиву мешавину свих тих информација с обзиром на унос корисника.

Пример ДАЛЛ ЈЕ 2

Хајде да се играмо мало да разумемо ДАЛЛ·Е. Хајде да га поделимо на следећа три корака.

  1. Замислите дуге, облаке и једнороге који лете на плавом небу. Замислите каква би слика могла бити у вашој машти. Људи су најближа ствар коју имамо савршеном аналогу слике која је уграђена, а слика која вам је управо пала у главу је савршен пример за то. Можете само да нагађате о коначном производу, али имате добру идеју шта би требало да буде укључено. А приори модел води читаоца од речи у фрази до сцене у његовој или њеној машти.
  2. Сада можете почети да цртате. Оно што унЦЛИП ради је да претвара вашу менталну слику у праву скицу. Сада можете тачно да поново креирате други лик из истог описа, са истим основним статистикама, али са потпуно новим визуелним стилом. ДАЛЛ·Е 2 такође може да генерише јединствене слике из постојеће слике уграђене на овај начин.
  3. Обратите пажњу на скицу коју сте направили. Ово се дешава када скицирате опис 'једнорога усред облака, а дуга се уздиже на небу.' Сада прегледајте слику и текст да одредите шта најбоље илуструје друго (сунце, кућа, дрво, итд.) и шта најбоље илуструје тему, стил, боје итд. Оно што ЦЛИП ради је кодирање карактеристика. текст и слике.

Сада када знамо шта је ДАЛЛ-Е, пређимо на следећи одељак и разумемо његове карактеристике.

Савет: Како да креирате реалистичне слике помоћу услуге ДАЛЛ-Е-2 АИ

Карактеристике ДАЛЛ Е 2

Испод су спецификације ДАЛЛ·Е 2.

  1. Варијације
  2. Бојање
  3. Тект Дифференцес

Хајде да причамо о њима детаљно.

како направити визит карте у ворд-у 2010

1] Варијације

ДАЛЛ·Е 2 иде даље од једноставног превођења реченице у слику. ОпенАИ може да експериментише са генеративним процесом, производећи различите резултате за дати потпис захваљујући робусним ЦЛИП уграђивањима. Оно што ЦЛИП 'види' у свом 'мисли' је оно што сматра важним из улаза (остаје исто за све слике) и оно што се може заменити (што се мења за различите слике). Кад год је то могуће, ДАЛЛ·Е 2 ће задржати и 'смислене информације... и естетске аспекте'.

2] Бојање

ДАЛЛ·Е 2 може да мења постојеће фотографије аутоматским попуњавањем. У следећем примеру, лева слика је оригинална слика, а централна и десна фотографија имају елемент нацртан на различитим местима. ДАЛЛ·Е 2 одговара додатном елементу у стилу слике. Такође ажурира текстуре и рефлексије како би одражавао нови елемент.

читати : Шта можете да урадите са ЦхатГПТ-ом

3] Разлике у тексту

ДАЛЛ·Е 2 конвертује слике користећи разлике у тексту. ДАЛЛ·Е 2 такође има напредне могућности интерполације које вам омогућавају да мењате објекте. Један корисник Твитера успео је да 'неморденизује' свој иПхоне. твиттер.цом да то проверим.

Ако вам се свиђају ове функције, све што треба да урадите је да одете на опенаи.цом а затим се регистровати. Можете да направите нови налог или да користите постојеће Мицрософт или Гоогле налоге да бисте се пријавили. Када то урадите, добићете неке бесплатне кредите, ако желите више, морате да платите.

Ово су неке од карактеристика ДАЛЛ·Е 2, он има много сјајних случајева употребе, међутим увек се препоручује да се не ослањате превише на АИ алате. На крају крајева, они нису ништа друго до алати који се користе за обављање посла, они никада не могу заменити нечију емоционалну интелигенцију.

Такође прочитајте: Најбоље Деепфаке апликације, софтвер и веб локације.

Шта је ДАЛЛ Е 2
Популар Постс