OpenAI lansirao novu verziju modela za generisanje slika sa poboljšanim razumevanjem vizuelnih jezika i širim opcijama formata
OpenAI je objavio ChatGPT Images 2.0, novu generaciju svog modela za generisanje slika, dostupnu svim korisnicima ChatGPT-a od 21. aprila 2026. godine. Kompanija ističe da ovaj model predstavlja značajan iskorak u kvalitetu generisanih slika, posebno kada je reč o razumevanju uputstava, prikazu gustog teksta i odnosu objekata u sceni. Images 2.0 prvi put uključuje i sposobnosti rezonovanja, što omogućava modelu da pretražuje internet i verifikuje svoje rezultate, čime se povećava pouzdanost pri zahtevima za preciznošću i vizuelnom koherentnošću.
Posebna pažnja u razvoju modela posvećena je podršci za ne-latinične jezike. OpenAI navodi da je Images 2.0 ostvario značajna poboljšanja u razumevanju i prikazu japanskog, korejskog, kineskog, hindi i bengalskog jezika. Model sada bolje replicira specifične karakteristike različitih vizuelnih jezika, što ga čini korisnijim za zadatke kao što su prototipiranje igara i storyboard dizajn.
Novi model donosi i veću fleksibilnost po pitanju formata slika: moguće je generisati slike sa odnosom širine i visine do 3:1 ili 1:3, kao i dizajne u rezoluciji do 2K. Images 2.0 može proizvesti do osam slika odjednom, što ubrzava proces rada kod korisnika sa kompleksnijim potrebama. U prvim testovima model je uspešno generisao slike u pixel art stilu, konvertovao slike u PNG sa transparentnom pozadinom i kreirao kratke stripove, demonstrirajući napredak u odnosu na prethodne verzije.
ChatGPT Images 2.0 dostupan je svim korisnicima, uključujući Free i Go nivoe servisa, dok Plus i Pro pretplatnici dobijaju pristup naprednijim izlazima. Model je integrisan i u OpenAI API i Codex aplikaciju za kodiranje, koja je nedavno dobila mogućnost generisanja slika. Ovo lansiranje dolazi neposredno nakon što je konkurentska kompanija Anthropic predstavila svog asistenta za dizajn, što ukazuje na ubrzanu konkurenciju u oblasti AI vizuelnih alata.
Dalji razvoj i poređenje sa drugim modelima na tržištu, kao što je Google-ov Nano Banana 2, pokazaće koliko su ova poboljšanja značajna u realnoj upotrebi i na kojim poljima OpenAI može dodatno unaprediti svoje rešenje.
Source: https://www.engadget.com/ai/chatgpt-images-20-is-better-at-rendering-non-latin-text-190000153.html









