Tehnika preusmeravanja modela donosi značajne uštede, ali preti prihodima vodećih AI kompanija
Nova tehnika poznata kao model routing omogućava velikim AI servisima da automatski šalju korisničke zahteve jednostavnijim, jeftinijim modelima kada zadatak to dozvoljava, dok zahtevniji upiti ostaju rezervisani za najskuplje i najmoćnije modele poput onih koje nude OpenAI i Anthropic. Ovaj pristup ima direktan uticaj na troškove krajnjih korisnika, ali i na prihode vodećih AI kompanija.
Velike kompanije poput OpenAI i Anthropic ostvaruju veći deo prihoda upravo kroz korišćenje svojih naprednih modela, čije pokretanje zahteva izuzetno skupe resurse i specijalizovane čipove. Međutim, model routing omogućava developerima i firmama da značajno smanje troškove korišćenjem slabijih modela gde je to dovoljno, čime se značajno smanjuje ukupna potrošnja na AI.
Praktično, kada korisnik postavlja jednostavno pitanje ili zahteva osnovnu analizu, sistem automatski prebacuje zadatak na osnovni model, dok se samo za kompleksne zadatke koristi premium model poput GPT-4 ili Claude 3. Ova strategija donosi višestruke uštede: smanjuje računarske troškove, ubrzava vreme odgovora i optimizuje ukupnu upotrebu AI resursa.
Iako korisnici i firme ostvaruju prednosti kroz niže račune, ovakav trend direktno utiče na poslovne modele kompanija poput OpenAI i Anthropic, koje su do sada profitirale od masovne upotrebe najskupljih modela. S obzirom na to da je infrastruktura za treniranje i pokretanje velikih modela izuzetno skupa, svako smanjenje upotrebe premium modela može dugoročno uticati na prihode i dalji razvoj AI industrije.
Primena model routinga sve više postaje standard u AI industriji, a očekuje se da će ovaj trend dodatno smanjivati troškovnu strukturu korisnika, ali i podstaći konkurenciju među AI provajderima. Za tržište kapitala i investitore, ostaje otvoreno pitanje kako će vodeći akteri adaptirati svoje poslovne modele u novom okruženju gde je efikasnost iznad ekskluzivnosti.









