Povodom emisije Načisto TV Vijesti, u kojoj se debatuje o tome da li se autoru emisije u video poruci javio odbjegli Miloš Medenica ili njegov avatar, pitali smo AI:
Je li moguće da AI u realnom vremenu simulira stvarnu osobu i reaguje na pitanja?
“Kratak odgovor je:
Da, to je već sada tehnički moguće i koristi se u razne svrhe.
Tehnologija koja stoji iza ovoga naziva se Digitalni blizanci (Digital Twins) ili AI Avatari, a funkcioniše kombinovanjem nekoliko različitih grana vještačke inteligencije u jedan povezani sistem.
Evo kako taj proces izgleda u “realnom vremenu”:
Kako funkcioniše simulacija osobe?
Da bi AI simulirao stvarnu osobu, on mora istovremeno da procesira tri glavna elementa:
1. Slušanje i razumijevanje (STT & NLP): AI koristi Speech-to-Text da pretvori tvoj glas u tekst, a zatim Large Language Model (poput onoga koji pokreće ChatGPT) da razumije značenje i generiše odgovor u stilu te osobe.
2. Kloniranje glasa (TTS): Pomoću samo nekoliko minuta audio zapisa stvarne osobe, AI može generisati novi govor koji zvuči identično toj osobi, sa istom bojom glasa, akcentom i emocijom.
3. Vizuelna simulacija (Video Synthesis): Tehnologije poput onih koje razvijaju kompanije HeyGen ili Synthesia omogućavaju kreiranje video prikaza lica koji se pomjera u skladu sa izgovorenim riječima, uključujući mimiku i treptanje.
Gdje se ovo već primjenjuje?
♦ Služba za korisnike: Kompanije koriste digitalne avatare koji izgledaju kao stvarni ljudi za interakciju sa klijentima.
♦ Obuka i edukacija: Simulacije poznatih profesora ili stručnjaka koji “uživo” odgovaraju na pitanja studenata.
♦ Gejming i zabava: NPC likovi (likovi u igrama) koji više nemaju unaprijed napisan scenario, već pričaju slobodno koristeći AI.
♦ Deepfake tehnologija: Nažalost, ovo se koristi i za prevare, gdje se u video pozivima simuliraju direktori kompanija ili članovi porodice kako bi se iznudio novac.
Ograničenja i izazovi
Iako zvuči fascinantno, još uvijek postoje određene prepreke:
♦ Kašnjenje (Latency): Za procesiranje govora, razmišljanja i generisanja videa potrebno je par sekundi. Teško je postići “savršenu” reakciju bez milisekunde zastoja, mada se taj jaz ubrzano smanjuje.
♦ “Uncanny Valley” efekat: Ljudi često osjete nelagodu kada vide nešto što izgleda skoro kao čovjek, ali ima sitne, neprirodne pokrete očiju ili usana.
♦ Etika i sigurnost: Pitanje pristanka (da li osoba želi da bude simulirana) i rizik od zloupotrebe su trenutno najveće teme u svijetu tehnologije.
Važna napomena: Tehnologija je postala toliko napredna da je danas veoma teško razlikovati visokokvalitetni AI video poziv od stvarne osobe bez pažljivog posmatranja sitnih artefakata na slici ili neobičnih prelaza u glasu.
Želiš li da ti preporučim neke konkretne alate ili platforme gdje možeš sam isprobati kreiranje ovakvog avatara?








0 Comments