Tato umělá inteligence dokáže napodobit váš hlas z pár sekund záznamu, je to děsivé

OpenAI odhalilo novou revoluční schopnost: schopnost vytvářet vysoce realistické syntetické hlasy trénováním na pouhých 15 sekundách zvukového záznamu.

hlas AI
Kredit: 123RF

OpenAI právě natáhlo závoj Voice Engine, zcela nová umělá inteligence, která dokáže napodobit jakýkoli hlas poté, co jej posloucháte po dobu pouhých 15 sekund. Systém Voice Engine není úplně nový, protože byl poprvé vyvinut společností OpenAI na konci roku 2022, přičemž první verze se již používá pro funkce syntézy řeči v populárním hlasovém asistentovi, ChatGPT AI společnosti. Je to však poprvé, co o tom Open AI veřejně mluví.

Jak je popsáno v nedávném příspěvku na blogu OpenAI, Voice Engine umožňuje uživatelům vytvářet úžasně realistické syntetické hlasy, které dokážou číst jakýkoli poskytnutý text „emotivním a realistickým způsobem“. Společnost se podělila o některé příklady hlasových klonů, které demonstrují působivou přirozenost, i když některé z nich mají stále trochu umělý okraj.

OpenAI chce přinést revoluci na trhu s Voice Engine

OpenAI uvádí několik slibných reálných případů použití této technologie, jako např vzdělávací nástroje, překlady podcastů do nových jazyků, přístup ke vzdáleným komunitám a dokonce i komunikační pomoc pro neverbální lidi. Společnost již spustila „malý náhled“ s vybranými partnery, kteří získali předběžný přístup.

Age of Learning, vzdělávací společnost, použila Voice Engine ke generování skriptovaných hlasových projevů, zatímco aplikace pro vizuální vyprávění AI HeyGen uživatelům dává možnost vytvářet plynulé překlady zvuku hlasem a přízvukem původního mluvčího.

Nejvýraznějším příkladem jsou bezpochyby výzkumníci, kteří toho byli schopni „obnovit hlas“ mladé ženy, která po nádoru na mozku ztratila schopnost mluvitškolením Voice Engine na pouhých 15 sekundách staré nahrávky.

OpenAI již varuje před nebezpečím takové technologie

Navzdory těmto potenciálně revolučním případům použití však OpenAI zaujímá k dalšímu šíření systému hlasového klonování záměrně opatrný postoj. Společnost se dovolává naléhavá potřeba chránit se před zneužitím technologie ke škodlivým účelůmtak jako šíření nepravdivých informací a hlasové klonování bez souhlasu uživatele.

Dokážete si představit, že někteří lidé by se mohli rychle bavit šířením lživých zpráv od známých osobností na sociálních sítích. Viděli jsme také podvodníky, kteří používají umělou inteligenci k napodobování vašich blízkých a žádají vás o peníze po telefonu,

Důsledky používání hlasové klonovací umělé inteligence pro dezinformační kampaně jsou zvláště významné vzhledem k velkým letošním volbám v USA a Velké Británii. S tím, jak jsou generativní nástroje umělé inteligence v oblasti zvuku, textu, obrázků a videa stále sofistikovanější, je stále obtížnější odlišit skutečný obsah od obsahu umělého. Nedávno jsme například viděli Sora, další AI od OpenAI, která dokáže během okamžiku generovat velmi realistická videa.

OpenAI uznalo, že je nezbytné začít budovat „společenskou odolnost“ tváří v tvář výzvám, které tyto technologie představují. Podpořila opatření jako např postupné opuštění hlasové autentizace u citlivých účtů a vyzval k politikám na ochranu hlasů jednotlivců a také vzdělávání veřejnosti o možnostech umělé inteligence.

V současné době jsou všechny vzorky řečového enginu vytvořené partnery OpenAI digitálně opatřeny vodoznakem, který pomáhá sledovat jejich původ. Společnost také uvedla, že vyžaduje výslovný souhlas od původního mluvčího a neumožňuje opakování hlasů politických kandidátů během volebních období.

Leave a Reply

Your email address will not be published. Required fields are marked *