Társalgási interfészek Kínából

2016. március 4. 9:00
A Baidu hang- és beszédtechnológiái begyorsíthatják az ember-számítógép interakció fejlődését. Programok előbb-utóbb az embernél pontosabban írnak át mandarinul elhangzó szövegeket.

A Baidu világviszonylatban is az egyik legfontosabb szereplője a Kínában egyre gyorsabban terjedő társalgási interfészek fejlesztésének. Ezek az interfészek teszik hatékonyabbá az ember-gép interakciót.

A gépi tanulás fejlődésével praktikusabbak lettek a hangalapú alkalmazások, például a hangvezérlés, és az interfészek akár zajos környezetben is működnek.

„A beszédtechnológia közelít egy ponthoz, ahol annyira megbízható lesz, hogy utána már csak használni fogjuk, és nem is gondolunk rá. A legjobb technológia gyakran láthatatlan, és remélem, a beszédfelismerés is így fog eltűnni a háttérben” – jelentette ki Andrew Ng, stanfordi docens és a Baidu vezető kutatója.

Szerinte a hang hamarosan többeszközös interakcióra is alkalmas lesz. Olyan eszközökre is gondol, mint például a robotok és a háztartási berendezések.

A Baidu pekingi és szilícium-völgyi csapata a pontosabb beszédfelismerésen és azon dolgozik, hogy a számítógépek hatékonyabban elemezzenek mondatokat. 2015 novemberében a cég szilícium-völgyi részlege bejelentett egy a hangokat szavakkal és mondatokkal összetársító mély ideghálóból álló beszédfelismerő motort. Az ideghálóba többmillió átírt beszédpéldát tápláltak, azokon gyakorol. A kutatók szerint a háló pontosan tud azonosítani elhangzott szavakat, és idővel az embernél is pontosabban fog átírni mandarin szövegrészeket.
 


Kedvelje a Makronómot Facebookon!



Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!

Bejelentkezés