OpenAI spouští Sora, AI, která dokáže generovat ultrarealistická videa

OpenAI, tvůrce ChatGPT, právě odhalil pozoruhodný nový generativní video model nazvaný Sora, který dokáže vzít krátký textový popis a převést jej do podrobného videoklipu. Tady je to, co o něm víme.

OpenAI Sora

Zatímco Google právě oznámil svou novou Gemini 1.5 AI, OpenAI okamžitě zaútočila na Sora, svůj první nástroj schopný transformovat text na video.maximální dobu jedné minuty. Sora není jen další aplikace v digitální sadě nástrojů, ale se zdá být symbolem toho, co pro tvůrce a veřejnost čeká budoucnost.

Tady jsme opravdu hodně daleko od výsledků, které nabízí Runway AI, další technologie, která dokázala generovat videa trvající několik sekund, která byla dost rozmazaná, trhaná, zkreslená a někdy upřímně znepokojivá.

Co je Sora, nová revoluční AI OpenAI?

OpenAI pojmenovala svůj nový systém Sora, podle japonského slova, které znamená „ nebe “. Tým, který za technologií stojí, včetně výzkumníků Tima Brookse a Billa Peeblese, údajně zvolil název, protože „ evokuje myšlenku neomezeného tvůrčího potenciálu “.

OpenAI sdílí některé videoklipy generované jeho novou umělou inteligencí a výsledky jsou přinejmenším velkolepé. Na jednom z nich můžeme číst následující požadavek: „ Krásné zasněžené město Tokio je v plném proudu. Kamera se pohybuje po rušné městské ulici a sleduje několik lidí, kteří si užívají krásné zasněžené počasí a nakupují v okolních stáncích. Krásné okvětní lístky sakury létají ve větru spolu se sněhovými vločkami “. Jak bylo požadováno, generované video se odehrává na ulici v Tokiu a jasně to ukazuje Sora se naučila, jak do sebe objekty zapadají ve 3D. Kamera se poté ponoří do scény a sleduje pár procházející kolem řady obchodů.

Videa nástroje OpenAI jsou mnohem přesvědčivější než to, co nabízejí jiné existující nástroje, i když stále občas zaznamenáme nějaké drobné nedostatky. Na jednom z nich, kde vidíme ženu jdoucí po ulici, si všimneme kupř na několika snímcích, že jeho nohy nesledují správně pohyb.

Přečtěte si také – OpenAI opravdu chce zabít Google s tímto novým vyhledávačem ve vývoji

Sora zatím není dostupná všem

V tuto chvíli je Sora stále ve fázi vývoje, a proto není dostupná široké veřejnosti. OpenAI však již tento nástroj sdílela s některými akademiky a dalšími výzkumníky, kteří jej předají „červenému týmu“. Jedná se o malou skupinu lidí, kteří jsou zodpovědní zkoumat všechny způsoby, jak ji zneužít, s cílem pochopit nebezpečí, která taková technologie představuje.

Jisté je, že OpenAI bude muset najít způsob, jak zajistit, aby jejich videa nebyla používána k dezinformacím, protože si představujeme, že by se někteří lidé mohli bavit vytvářením falešných videí, která by mohla vést ke kontroverzi. Začátkem tohoto měsíce OpenAI oznámila přidání vodoznaků do svého nástroje pro převod textu na obrázek DALL-E 3, ale uvedla, že je lze „snadno odstranit“. Doufáme tedy, že společnost pracuje na novém způsobu, jak zajistit, aby její falešná videa byla snadno identifikovatelná.

OpenAI také poskytuje přístup k vybraným vizuálním umělcům, designérům a filmařům pro zpětnou vazbu. Poznamenává, že stávající model nemusí přesně simulovat fyziku složité scény a nemusí správně interpretovat některé případy příčiny a následku, proto tato technologie musí ještě dozrát, než bude široce dostupná.

Leave a Reply

Your email address will not be published. Required fields are marked *