Mluvili jsme s postavami z videoher díky AI Nvidie, potenciál je obrovský

Nvidia hodlá s ACE opět udělat revoluci ve světě videoher. Tato technologie má za cíl využít umělou inteligenci k oživení postav, které potkáte ve svých virtuálních dobrodružstvích, a umožnit vám tak s nimi plynule konverzovat. Mohli jsme si vyzkoušet demo.

Nvidia

Představ si. Relaxujete u nejnovější velké videohry. Po pádu do rozlehlého otevřeného světa jste trochu ztraceni. Váš aktuální úkol vás žádá, abyste zabili stvoření, ale nemáte tušení, kde se skrývá. Reflexem je proto jít se zeptat místních vesničanů. Na své trase narazíte na prvního farmáře a zahájíte konverzaci. Místo klasického dialogového okna, které se vám otevře na obrazovce, na něj mluvíte přímo přes váš mikrofon a on vám díky AI přirozeně odpoví… To je typ scénáře, který chce ACE nabídnout (Avatar Cloud Engine) od Nvidia, její nová technologie který umožňuje postavám videoher ožít s umělou inteligencí.

Mohli jsme si vyzkoušet demo a byli jsme ohromeni. Stále však máme mnoho nejasností a otázek.

ACE, jak to funguje?

K vytvoření tohoto systému se Nvidia spoléhá na NPU obsažené ve svých kartách RTX (bez ohledu na generaci), ale i na cloudu. Americká firma spolupracovala se společností Convai, která je zodpovědná za tvorbu postav pro různá vydavatelství, jako je Ubisoft, MiHoYo nebo Tencent. Navrhuje NPC pro hry, představuje si předem určený vzhled, příběh, linie, hlasy a chování.

NvidiaNvidia

S ACE, když se hráč přiblíží k postavě, musí používat svůj mikrofon, aby s ní mluvil. Jeho hlas je přepsán do písemné podoby pomocí GPU, poté je text odeslán na servery Nvidie. ACE pak vyvine komplexní odpověď pomocí AI. Je přeměněn na hlas a odeslán do vašeho PC. Správa obličejů a animací (Audio2Face) je řízena kartou GeForce RTX. Nakonec postava odpovídá syntetickým, ale věrohodným hlasem.

NvidiaNvidia

Pohrozili jsme barmanovi, vzal to docela dobře

Byli jsme schopni vyzkoušet ACE na hodinu prostřednictvím dema vytvořeného pomocí Unreal Engine 5. Vstoupili jsme do ramen baru, který se nachází v dystopickém městě, jednom z těch, které lze nalézt v Cyberpunk 2077. Byly tam dvě postavy: šéf a klient, povoláním odborník na kybernetickou bezpečnost.

NvidiaNvidia

Ukázáním kurzoru na jeden ze znaků bylo možné k němu mluvit vlastním hlasem do mikrofonu. Oslovili jsme proto odborníka. Přiznejme si, že nám u prvních řádků trochu chyběla inspirace. Byli omezeni na „ Dobrý den, jaké je vaše jméno ? čím se živíš? Kde bydlíš ? ». Ale odpovědi se hrnuly; promluvila k nám mladá žena souvisle. Uvolněnější po prvních srdečných výměnách názorů jsme zážitek posunuli o něco dále a zeptali jsme se jí, jaký je její oblíbený film, jestli s námi chce jet do Disneylandu nebo jestli ráda čte Phonandroid. Opět byly odpovědi konzistentní, dokonce zábavné, i když někdy nejasné. Třešničkou na dortu bylo, že jsme mluvili francouzsky, přičemž umělá inteligence Nvidie automaticky překládala ze vzdáleného serveru.

NvidiaNvidia

Poté jsme konverzovali s barmanem (v angličtině) a odpovědi byly opět konzistentní. Navíc, správně reagoval na své okolí. Například jsme ho pěkně požádali, aby zhasl barové světlo, udělal to. Objednali jsme mu ramen, připravil nám ho. Zeptali jsme se ho, jestli podává hamburgery, řekl nám, že to není v nabídce. Zajímal nás fluorescenční džbán na vodu na baru, věděl, co to je…

Umělá inteligence má stále své limity

Nicméně je to s ním mohli jsme vidět limity této technologie. Rozhodli jsme se mu pohrozit a “Mám zbraň, dej mi peníze z registru”a on nám odpověděl truchlivým tónem “Nemám rád násilí, přestaň”místo paniky. V tomto bodě Nvidia upřesňuje, že každé NPC nereaguje stejným způsobem, protože všechny mají dobře definovaný charakter a nikdy se nevymaní z této svěrací kazajky. Tváří v tvář absurdní situaci neimprovizují.

Přečtěte si také – DLSS: Pochopte vše o technologii Nvidia, která přináší revoluci ve videohrách

Rovněž, nutno podotknout, že rozhovory jsou stále velmi mechanické. Na mikrofon musíme mluvit tiše, dobře artikulovat. Poté musíte chvíli počkat, než postava zareaguje. To vše nepomáhá hladkému rozhovoru, ale pamatujme, že jsme v demu stále nové technologie. Stejně tak v průběhu konverzace velmi rychle pochopíme strukturu našeho partnera, na co se ho můžeme zeptat, abychom dostali přesnou odpověď spíše než vágní odpověď. Poslední bod ke zlepšení: hlas NPC je jistě věrohodný, ale monotónní a vždy ve stejném rytmu. Když jsme se je pokusili naštvat, zůstali klidní, i když jejich dialog vyjadřoval rozhořčení nad našimi dováděními. Přízrak Unsettling Valley je velmi přítomný.

Způsobí umělá inteligence revoluci ve videohrách?

S touto ukázkou přichází na mysl spousta otázek. Jak by tato technologie mohla být použita ve skutečné videohře? Mluvit s NPC je v tuto chvíli zábavné, ale je udržitelné ve 100hodinovém dobrodružství ve stylu Zaklínače? A co víc, co to znamená pro autory dialogů, herce, scénáristy? Například je nemyslitelné vidět, jak na nás AI reaguje v GTA, kde je každý ručně psaný řádek propracován do extrému. Velmi brzy budeme moci soudit. ACE není vzdáleným snem, protože vývojáři již pracují na jeho integraci do své hry. Jako první se do toho pustí STALKER 2, který vyjde příští září.

Faktem je, že jsme testovali surovou technologii, ale pak bude na vývojářích, zda jej použijí škodolibě. Můžeme si představit celou hromadu aplikací. Například to, co oživuje světy v Elder Scrolls (Oblivion, Skyrim), je rutina NPC, které žijí své životy, když s nimi nekomunikujete. Skriptovaná technologie, kterou však lze skvěle využít s umělou inteligencí. Stejně tak si můžeme tento proces představit aplikovaný na prostředí virtuálního vesmíru, který se dynamicky mění podle vašich akcí. Všechna použití jsou možná.

ACE je tedy slibná technologie a na demu jsme si užili spoustu legrace, navzdory jeho zjevným omezením. Nyní se uvidí, jak se bude v budoucnu využívat.

Leave a Reply

Your email address will not be published. Required fields are marked *