Connect with us

Hi, what are you looking for?

Hi-Tech

ChatGPT Images 2.0 unapređuje prikaz ne-latiničnog teksta i detaljnije generiše slike

OpenAI lansirao novu verziju modela za generisanje slika sa poboljšanim razumevanjem vizuelnih jezika i širim opcijama formata

Foto Izvor: Pixabay / Didgeman

OpenAI lansirao novu verziju modela za generisanje slika sa poboljšanim razumevanjem vizuelnih jezika i širim opcijama formata

OpenAI je objavio ChatGPT Images 2.0, novu generaciju svog modela za generisanje slika, dostupnu svim korisnicima ChatGPT-a od 21. aprila 2026. godine. Kompanija ističe da ovaj model predstavlja značajan iskorak u kvalitetu generisanih slika, posebno kada je reč o razumevanju uputstava, prikazu gustog teksta i odnosu objekata u sceni. Images 2.0 prvi put uključuje i sposobnosti rezonovanja, što omogućava modelu da pretražuje internet i verifikuje svoje rezultate, čime se povećava pouzdanost pri zahtevima za preciznošću i vizuelnom koherentnošću.

Posebna pažnja u razvoju modela posvećena je podršci za ne-latinične jezike. OpenAI navodi da je Images 2.0 ostvario značajna poboljšanja u razumevanju i prikazu japanskog, korejskog, kineskog, hindi i bengalskog jezika. Model sada bolje replicira specifične karakteristike različitih vizuelnih jezika, što ga čini korisnijim za zadatke kao što su prototipiranje igara i storyboard dizajn.

Novi model donosi i veću fleksibilnost po pitanju formata slika: moguće je generisati slike sa odnosom širine i visine do 3:1 ili 1:3, kao i dizajne u rezoluciji do 2K. Images 2.0 može proizvesti do osam slika odjednom, što ubrzava proces rada kod korisnika sa kompleksnijim potrebama. U prvim testovima model je uspešno generisao slike u pixel art stilu, konvertovao slike u PNG sa transparentnom pozadinom i kreirao kratke stripove, demonstrirajući napredak u odnosu na prethodne verzije.

ChatGPT Images 2.0 dostupan je svim korisnicima, uključujući Free i Go nivoe servisa, dok Plus i Pro pretplatnici dobijaju pristup naprednijim izlazima. Model je integrisan i u OpenAI API i Codex aplikaciju za kodiranje, koja je nedavno dobila mogućnost generisanja slika. Ovo lansiranje dolazi neposredno nakon što je konkurentska kompanija Anthropic predstavila svog asistenta za dizajn, što ukazuje na ubrzanu konkurenciju u oblasti AI vizuelnih alata.

Dalji razvoj i poređenje sa drugim modelima na tržištu, kao što je Google-ov Nano Banana 2, pokazaće koliko su ova poboljšanja značajna u realnoj upotrebi i na kojim poljima OpenAI može dodatno unaprediti svoje rešenje.

Source: https://www.engadget.com/ai/chatgpt-images-20-is-better-at-rendering-non-latin-text-190000153.html

Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

Možda će vas interesovati

Biz Srbija

Ulazak Aman-a u vlasničku strukturu DIS-a menja konkurentsku sliku maloprodajnog sektora Srbije, detalji transakcije još nisu objavljeni

Biz Srbija

U maju četiri neradna dana, a za rad na praznik minimalno 110 odsto veća dnevnica, bez zakonskih kazni za poslodavce

Biz Srbija

Nova mera omogućava zaposlenima u Italiji plaćeno odsustvo radi brige o bolesnim životinjama, što ima ekonomske i socijalne implikacije na radna prava i tržište...

Hi-Tech

Kompletan vodič za praćenje muškog i ženskog NCAA turnira 2026. uz detalje o platformama i terminima