Vigyázat! Cookikat tolunk! Adatvédelem.
Csináltak egy mesterséges intelligenciát, ami saját magát tanította meg beszélni
Kínai fejlesztők a világ eddigi leghatékonyabb beszédszintetizátorát hozták létre. A mesterséges intelligenciának nincs szüksége emberi beavatkozásra, magától tanulja meg, hogyan kell kiejteni a szavakat. Már csak az érzelem hiányzik a mondandójából.

A mesterséges intelligenciák fejlesztésének következő állomása, hogy a gépeket ne csak feladatok végrehajtására tanítsuk meg, hanem beszélni is. A Google tavaly már a WaveNet nevű fejlesztését, ami a DeepMind nevű mesterséges intelligencia segítségével képes volt a beszéd szintetizálására. Most a kínaiak legnagyobb keresője, a Baidu állt elő egy fejlesztéssel, ami az eddigi legfejlettebb beszédszintetizáló program.

A Deep Voice további előnye, hogy a beszéd előállításához nincs szükség egy háttérben futó adatbázisra. A jelenleg használatban lévő alkalmazások – például a navigációs eszközök esetében – úgy olvassák fel a leírt szöveget, hogy a szavakat, mondatokat már jó előre rögzítették, így a szöveg felolvasásánál az algoritmus csak kikeresi és egymás mögé pakolja azokat. Emiatt viszont sokkal darabosabbá, gépiesebbé válik a beszéd.

A fejlesztés komoly segítséget jelenthet például a látássérült felhasználóknak is, akik egy weboldalt, mobilos alkalmazást vagy számítógépes programot a beszédszintetizáló szoftverek segítségére támaszkodva tudják használni. A Deep Voice által kimondott szavak azonban a jelenleginél érthetőbbek lesznek, így a megértésük is könnyebbé válhat.

Bár a Baidu fejlesztése már sokkal közelebb áll az emberi beszédhez, még mindig nem egészen olyan. A rendszer például nem tudja pontosan, egy hang kiadásához mennyi időre van szükség, ahogy érzelmi töltettel sem tudja ellátni a szavakat. Valós időben beszélgetni ugyanakkor (még) nem lehet vele, a szoftver egyelőre csak a szövegek felolvasására alkalmas. A fejlesztés mindenesetre biztató, a jövőben ugyanis jóval természetesebbek lehetnek majd a digitális asszisztensek.

7 hozzászólás

  • kléni 2017. március 25. 12:50

    1
    "a gépeket ne csak feladatok végrehajtására tanítsuk meg, hanem beszélni is"
    Magyarul, +1 feladatot kell végrehajtaniuk. :D
  • peti.97 2017. március 25. 19:36

    2
    Csak időkérdése volt ez is :D
    Egyébként az adatbázisa így az "agya" lesz, abba "tárolja" el hogy hogyan ejtse ki a szavakat. Csak sokkal komplexebb, mert így olyan szavakat is ki tud ejteni, amiket soha nem tanult meg.

    Egy példa hogy érthető legyen (meg hogy miért is nagy szó):
    Feladat: kombinálj két tárgyat:
    Adatbázis:
    komló + víz = sör
    szilva + hordó = pálinka
    autó + benzin = utazás
    ... stb
    Ekkor csak azokat tudja kombinálni amik fel voltak sorolva.
    De ha "megtanulja" akkor ilyenekre is (ami nincs benne az adatbázisban) tud mint mondani:
    komló + szilva = sörlinka

    Ez itt lehet hogy baromságnak tűnik, de ha az a feladat hogy olvass fel egy szöveget, lehet hogy számos szó nem lenne benne az adatbázisban ezért nem tudná megtenni, de mivel megtanult beszélni ezért fel tudja olvasni az eddigi "tapasztalatai" alapján.
  • peti.97 2017. március 25. 19:38

    3
    Jah és igen örülünk neki :D
    (bekaphatja a <reggelijét> aki fejlődésellenes)
  • [ törölt felhasználó ] 2017. május 17. 09:31

    4
  • [ törölt felhasználó ] 2017. május 17. 09:32

    5
    Jelen hetilap kiadója a HVG Kiadói Zrt.

    A hetilapban megjelentetett cikkek, fotóművészeti alkotások, egyéb szerzői művek csak a szerző, illetve a kiadó írásbeli engedélyével többszörözhetőek, közvetíthetőek a nyilvánosság felé, tehetőek nyilvánosság számára hozzáférhetővé a sajtóban [Szjt. 36. § (2)].

    Ez a nyilatkozat a szerzői jogról szóló 1999. évi LXXVI. törvény 36. § (2) bekezdésében foglaltak szerinti tiltó nyilatkozatnak minősül.
  • [ törölt felhasználó ] 2017. május 17. 09:33

    6
    Szerzői jogok, Copyright

    Jelen honlap kiadója a HVG Kiadó Zrt.

    A honlapon közzétett cikkek, fotóművészeti alkotások, egyéb szerzői művek csak a szerző, illetve a kiadó írásbeli engedélyével többszörözhetőek, közvetíthetőek a nyilvánosság felé, tehetőek nyilvánosság számára hozzáférhetővé a sajtóban [Szjt. 36. § (2)].

    Ez a nyilatkozat a szerzői jogról szóló 1999. évi LXXVI. törvény 36. § (2) bekezdésében foglaltak szerinti tiltó nyilatkozatnak minősül.
  • AcIv55 2017. május 17. 09:33

    7
    @cadmagician:
A hozzászóláshoz be kell jelentkezned.
Belépés, vagy ingyenes regisztráció!