Hašem Al-Gajli, jemenski molekularni biolog, popularizator nauke i reditelj najpoznatiji je po istoimenoj Facebook stranici koju je pokrenuo 2008. godine. Na njoj objavljuje infografike i kratke video zapise o naučnim vestima i istraživanjima. Do oktobra 2022. godine, stranica je imala više od 32 miliona pratilaca, a na Instagramu prati ga blizu milion ljudi.

Sa neverovatnim uspehom alata koji koriste veštačku inteligenciju za obradu fotografija, teksta ili snimaka, pojavilo se veliko interesovanje za „oživaljvanjem“ istorijskih ličnosti. Naime, na osnovu bisti, skulputra i slika Hašem uz pomoć veštačke inteligencije pokazao je kako su neke čuvene istorijske figure zaista izgledale. Iako veštačka inteligencija nije uvek precizna, finalni rezultat je najpribližnije onome kako su zaista izgledali.

U video-klipu pojavljuju se Nefertiti, Sokrat, Nikola Tesla, Isak Njutn, Galileo Galilej, Napoleon, Betoven, Vilijam Šekspir…

Kako AI pravi video od fotografije ili biste istorijske ličnosti?

Proces uključuje nekoliko ključnih tehnologija iz oblasti računarskog vida (computer vision), dubokog učenja (deep learning) i sintetizovanja pokreta i glasa. U nastavku su glavne faze:

1. Analiza lica sa fotografije ili biste

AI koristi algoritme prepoznavanja lica da identifikuje ključne tačke na licu – kao što su oči, obrve, usne, brada i konture lica. Čak i kada je u pitanju bista (skulptura), sistem prepoznaje osnovne oblike i orijentaciju lica.

Kraljica Elizabeta I prema veštačkoj inteligenciji Foto: printscreen/X/@TheFigen_

Njegov cilj je razumevanje anatomije i izraza lica kako bi mogla da se „mapira“ animacija.

2. Animacija lica pomoću modela pokreta

Zatim se koristi generativni model (najčešće neka varijanta Generative Adversarial Networks – GANs ili motion transfer AI), koji na osnovu postojeće fotografije ili biste simulira pokrete lica – kao što su govor, treptanje, naginjanje glave itd.

AI koristi uzorak – recimo, video prave osobe koja govori – i „prenosi“ taj pokret na statičku sliku. To se zove motion capture transfer.

3. Finalna obrada: osvetljenje, pozadina, teksture

Kleopatra prema veštačkoj inteligenciji Foto: printscreen/X/@TheFigen_

Na kraju, AI dodaje završne detalje:

osvetljenje i senke u skladu sa scenom

eventualnu pozadinu

boju kože, teksturu odeće, itd.

Koje se tehnologije koriste?

Deep Nostalgia (MyHeritage) – popularni servis za animaciju starih fotografija

D-ID, Synthesia, Reface – platforme za generisanje govorećih lica iz slika

First Order Motion Model – algoritam otvorenog koda za animaciju fotografija

StyleGAN / GANimation – generativne mreže za stvaranje realističnih izraza

