A Google mesterséges intelligenciája képes realisztikusan utánozni az emberi beszédet

2016. 09. 11. 12:00

Szokolai József

Még mindig nagyon könnyű megmondani, hogy egy valódi személy vagy egy gépi program hangja szól hozzánk, de ez már nem sokáig marad így.

A Google DeepMind csapata egy új WaveNet névre keresztelt mesterséges intelligenciával ált elő, ami megtévesztően jól tudja utánozni a valós emberi beszédet.

Jelenleg a fejlesztők két fajta metódust használnak a beszédprogramok fejlesztésére. Az egyik az, hogy fognak egy vállalkozó szellemű egyént és felmondatnak vele egy csomó szót és beszédrészletet, amit aztán rögzítenek. Ezzel csak az a baj, hogy a kiejtett hangokat és hanglejtéseket nehéz manipulálni a rendelkezésre álló felvételek alapján, így megkapjuk a „klasszikus” gépies kissé töredezet beszédet.

A másik módszer, hogy a szavakat elektronikus formába alakítják és ebbe belekódolják azt is, hogy hogyan kéne hangzaniuk. Ezt a módszert választva könnyebb lesz kikerekíteni a felmondandó szöveget, de még a másik módszernél is robotosabb hangot fogunk kapni.

A DeepMind csapata a fetiek helyett a mesterséges intelligencia felé fordult, hogy beszédprogramot hozzon létre. A Neurális hálónak nyers hanghullámokat adtak át feldolgozásra, amik valós emberi beszédekről készültek. A hanghullámok a vizuális reprezentációi a hangok formálódásának. A WaveNet ezeket tanulta meg és tulajdonképpen önálló hanghullámok formálásával képes megszólalni.

A programot már tesztelték is, ahol a résztvevő tesztalanyok sokkal emberibbnek találták a WaveNet hangját, mint a többi módszer által megszólaltatott programokét. Aki nem hiszi az pedig utána járhat a DeepMind honlapján, ahol is néhány minta már a kétkedő fülek rendelkezésére áll.

(Forrás: engadget.com Fotó forrása: pixabay.com)

Házimoziélmény OLED TV-be csomagolva

2021. 11. 05. 11:44

Mesterséges intelligencia vezérelte automatikus hang- és képminőség optimalizálás, csökkentett bemeneti késleltetés és számtalan high-tech megoldás teszi a tévézést felejthetetlen élménnyé -újgenerációs trónkövetelő a piacon.(X)

Maxold ki a bulikat - Mini megoldás a Panasonictól

2020. 10. 30. 17:12

TMAX5, nem mond semmit? Ideje megismerned és egy új szintre emelned az otthoni szórakozást, zenehallgatást. (X)

Asus Zenbook, a stílusos és hordozható csúcstechnika (x)

2024. 06. 06. 10:05

Az Asus Zenbook sorozat a prémium laptopok megtestesítője, amely ötvözi a letisztult dizájnt a kiemelkedő teljesítménnyel és a hordozhatósággal. Akár üzleti utazásokon veszel részt vagy kreatív profi, netán diák vagy, a Zenbook tökéletes társad lesz a mindennapokban.

IT Mozaik

A Google mesterséges intelligenciája képes realisztikusan utánozni az emberi beszédet

Házimoziélmény OLED TV-be csomagolva

Maxold ki a bulikat - Mini megoldás a Panasonictól

Asus Zenbook, a stílusos és hordozható csúcstechnika (x)

Szállj be a #challenge-be, és találkozz a VALMAR duóval!

Szállj velünk a Budaörsi Airshown augusztus 21-én! (X)

Új audio termékekkel készül a LAMAX a karácsonyra

Frissesség a forróságban – Így óvd meg zöldségeidet és gyümölcseidet nyáron

Cica-utazás. Így válassz macskahordozót, hogy nyugodtan induljatok útnak

7 lépés a belső erő megerősítéséhez

Hamarosan érkezik a tisztán elektromos Dacia Duster

Magyar síppal rajtol a női Eb

Megjelent a legújabb single a májusban érkező új AWS nagylemezről (x)

Tudatosság, vibrálás és színkavalkád - Így találkozik a színház és a fenntartható gasztronómia Ónodi Eszter életében(x)

Induljon a felfedezés, a meddőség okának felfedezése

Egy kávé ott, ahová Gárdonyi Géza és Weöres Sándor is járt?

Kincsesbánya lehetne: még mindig nem használjuk fel hatékonyan az adatokat

Asus Zenbook, a stílusos és hordozható csúcstechnika (x)

Szállj be a #challenge-be, és találkozz a VALMAR duóval!

Szállj velünk a Budaörsi Airshown augusztus 21-én! (X)

Új audio termékekkel készül a LAMAX a karácsonyra