NVIDIA oživuje digitálnych ľudí pomocou AI
Poprední vývojári AI aplikácií pracujú na vytváraní digitálnych ľudí, aby poskytli realistické avatary v komerčných aplikáciách a dynamické herné postavy. Dovoľujú im to technológie NVIDIA. Výsledky tejto práce sú prezentované na celosvetovej konferencii o umelej inteligencii GTC, ktorá sa koná tento týždeň v San Jose v Kalifornii. Svet pritom zaujali aj virtuálni asistenti s realistickou podobou.
Ukážky technológií ponúkajú spoločnosti Hippocratic AI, Inworld AI, UneeQ a ďalší. S použitím NVIDIA Avatar Cloud Engine (ACE) pre reč a animáciu, NVIDIA NeMo pre jazyk a NVIDIA RTX pre vykresľovanie pomocou ray-tracingu odprezentovali digitálne postavy, ktoré sú vďaka umelej inteligencii schopné prirodzenejšej jazykovej interakcie, vďaka čomu sú rozhovory s nimi realistickejšie a pútavejšie.
„NVIDIA ponúka vývojárom prvotriedny súbor technológií na vytváranie digitálnych ľudí,“ povedal John Spitzer, viceprezident pre vývojárske a výkonnostné technológie v spoločnosti NVIDIA. „Tieto technológie dokážu poháňať komplexné animácie a rozhovory potrebné na to, aby digitálne interakcie pôsobili reálne.“
Technológie na vytváranie digitálnych ľudí svetovej úrovne
Jedna z technológií NVIDIA Riva ponúka automatické rozpoznávanie reči (ASR) a prevod textu na reč (TTS). Ostatné služby následne vykreslia digitálnu podobu postavy. Tvorba modelov prebieha na cloude, je však možná aj lokálne na počítači, ak zariadenie disponuje dostatočným výkonom GPU.
S cieľom predstaviť nové možnosti svojej technológie oslovila NVIDIA popredných vývojárov z rôznych odvetví, aby vytvorili ukážky.
Spoločnosť Hippocratic AI vytvorila virtuálneho zdravotného asistenta. Dokáže telefonovať pacientom, zvládať úlohy koordinácie starostlivosti, poskytovať predoperačné pokyny, starať sa o starostlivosť po prepustení a mnoho ďalšieho. Nie je pritom dôležitá len funkčnosť, ale aj vizuálna prezentácia:
„Technológie ich oživujú špičkovými vizuálnymi efektmi a realistickými animáciami, ktoré pomáhajú lepšie nadviazať kontakt s pacientmi,“ povedal Munjal Shah, spoluzakladateľ a generálny riaditeľ spoločnosti Hippocratic AI.
UneeQ poskytuje avatarov s umelou inteligenciou, ktorí zastupujú spoločnosti online a môžu komunikovať so zákazníkmi v reálnom čase. Spoločnosť integrovala do svojej platformy mikroslužbu NVIDIA Audio2Face a s technológiou Synanim ML vytvorila ešte realistickejších avatarov.
NPC v hrách poháňané umelou inteligenciou
Nová ukážka technológie Covert Protocol posúva hranice toho, ako môžu postavy v hrách interagovať. Engine Inworld AI integruje technológie na presný prevod reči na text a realistické zobrazenie tváre.
Výsledkom je realistické vykreslenie nehrateľných postáv (NPC) v hrách. Vývojári kombinujú systémy, ktoré simulujú kognitívne funkcie, vnímanie a správanie s cieľom vytvoriť pohlcujúci príbeh v hre. AI NPC „otvárajú nové možnosti, ako môžu hráči dedukovať, vyvodzovať a hrať,“ povedal Kylan Gibbs, generálny riaditeľ spoločnosti Inworld AI.
Vývojári môžu začať pracovať s NVIDIA ACE tak, že sa zaregistrujú do programu skorého prístupu a začnú vyvíjať modely AI. Modely nájdu už dnes na stránke ai.nvidia.com, kde môžu získať prístup k NVIDIA NIM, balíku ľahko použiteľných mikroslužieb navrhnutých na urýchlenie nasadenia generatívnej AI, pre Riva a Audio2Face.