Trendfigyelő

22_3046307_poster.jpg
Forrás: ITB
Szorgos asszisztensként jegyzetel a Google

Billentyűzés helyett diktálj a gépnek!

Nem ismeretlen fogalom a hangalapú szövegszerkesztés és diktálás, az Apple gépein már bevált gyakorlat. A Google is folyamatosan fejleszti online irodai csomagját, most az egyszerűen kezelhető, „titkárnői” feladatokat is ellátó hangvezérléses megoldását tökéletesítette a magyar felhasználók számára.

Sokan egyfajta egzotikumnak gondolják a hangvezérlést, pedig okostelefonon, táblagépeken dolgozva az egyik legjobb megoldás. Nemcsak azért mert gépelni kényelmetlen még az egyre nagyobb érintőképernyőkön is, de mindenki gyakran melléüt az ujjas bevitel során. Nem kell már folyton bámulnunk sem a képernyőt, mint a „szkrínédzserek” teszik a közösségi médiáskodásuk során, csukott szemmel is diktálhatunk a mobilban lakozó mesterséges intelligenciának. Bár még nem tökéletes a hangvezérlés, de az öntanuló algoritmusok korában folyamatosan javul. Láthattuk, mire képes a gépi elme, nemrég a go világbajnokát is legyőzte.

 

Titkárnő helyett

A Google Docs látványosan fejlődik, és egyre jobban figyelnek fejlesztői arra, hogy ne váljon bloat‑ware-ré (terjedelmesedjen minden határon túl), mint az asztali, irodai alkalmazások. Szerencsére itt még megmaradt a hatékonyság és a kollaboráció, az online munkavégzés egyszerűsége.

Már tavaly ősszel lehetett magyarul diktálni a Dokumentumoknak, most 2016 tavaszán már akár formázni is tudunk a programmal – angolul. A teljes hangvezérlés luxusát csak akkor értékeljük igazán, ha eddig iPad-en dolgoztunk és a Siri volt a barátunk. Manapság digitális asszisztensek terén a Google vezet, Now nevű megoldása az Androidos telefonokon könnyebben kezelhető, mint az Apple Sirije. A Dokumentumok diktálási és formázási lehetőségével pedig mintha meg is haladta volna az almás rendszert.

 

Diktálás a gyakorlatban

Meglepően jól vizsgázott a diktálás magyar nyelven. Hogy működjön az aktuális dokumentumunkban, az Eszközök menüben a „Hangvezérelt írás...”tételt kell választanunk, majd be kell állítani a magyar nyelvet. Ezután kattintsunk a mikrofonra (az ettől piros lesz), és már mehet is a diktálás a digitális titkárnőnek.

Mire jó a diktálás?

Diktálni és hanggal keresni sokkal könnyebb a hétköznapokban. Jegyzeteket és ötletetek is egyszerűbb ezen a módon rögzíteni, és az emaileket is könnyebben lehet így megfogalmazni – vezetés közben.

Bizonyos szakmákban már kötelező a gépi diktálás használata. Például kórházakban és háziorvosi rendelőkben használják a magyar (!) Belux cég Globalspeech beszédfelismerő és diktálási megoldását. Az orvosi beszédleíró szoftver radiológiai modulja eredményesen működik számos állami és magán fMRI- és CT-diagnosztikai központban. Hatékonnyá teszi a munkamenetet, mivel az orvosnak nem kell megvárnia az asszisztenst a leletezéssel, helytől függetlenül teheti meg. Használják teleradiológiai célokra is: az interneten kapott képeket leletezik.

A másik fontos terület a jog: a Globalspeech-et bíróságok, ügyészségek és ügyvédi irodák is használják a jogi okiratkészítés folyamatának megkönnyítésére. A beszédfelismerés után kapott szöveget könnyebb korrektúrázni, szerkeszteni, mint egy klasszikus diktálás kimenetét.

Jó hírünk a magyar PC-s felhasználóknak: a szöveget meglepően kevés hibával begépeli a szoftver. Rossz hírünk, hogy a szövegünk hanggal nem tagolható (egyelőre?), sem írásjeleket, sem formázási eszközöket nem tudunk aktiválni magyar nyelven. (Ha iPad-en „hangoskodunk”, akkor van pont, vessző és más írásjelek.) Vagyis jegyzetelni lehet, ha éppen valami remek ötlet eszünkbe jutott, de a formázás csak akkor működik, ha angolul diktálunk. Ha a nóvumokat is tesztelni akarjuk, akkor a dokumentum alapértelmezett nyelvének angolnak kell lennie, innentől kezdve már a Kánaán vár ránk, mert szinte minden szövegszerkesztési parancsot hangosan kivitelezhetünk, sőt a szerkesztés közben a „Voice Command Help” hatására ezeket bármikor elő is hívhatjuk.

Csak városi legenda, hogy az obszcén szavakat automatikusan kiszűri a rendszer a diktálás során, csak néhány p-vel kezdődő szónál ad csillagot, a többit az olvasó fantáziájára bízzuk.

 

Könnyű falat volt a magyar nyelv

Mégsem lehet annyira nehéz a magyar nyelv, hiszen a Google gépi algoritmusai néhány hét alatt elboldogultak vele. Egy spanyol szakember, Pedro J. Moreno segített ebben, négy évvel ezelőtt végezték el a „magyarítást”, alapvetően az Android beszédfelismerési képességeinek megvalósítása és elterjesztése során.

Neki és csapatának nem volt nehéz munkája, ehhez nem kellett megérteni a magyar nyelvet. Egy nyelv gépi feldolgozásához akusztikai, lingvisztikai, és lexikai információk szükségesek róla. A szoftver nem beszéli a nyelvet, hanem listázza a találatok alapján a hangzó szöveget. Az ilyen találatok alapján lehet marketing célokra is használni, és POI- (point of interest-) alkalmazásokat hozzákapcsolni például étteremkeresőt.

 Az élő, magyar adatgyűjtés sem hiányozhatott, írott anyagokat is feldolgoztak. Egyetemistákkal és önkéntesekkel történt az akusztikai anyaggyűjtés, velük rögzítették a hangmintákat, így készült az a nyelvi „átlagtartomány”, amely alapján a gép figyeli és megérti magyar anyanyelvű gazdájának hangszínét és hanglejtését.

Kazinczy anyanyelvét négy hét alatt sikerült a Google mérnökeinek digitalizálni. Nem kell elkeserednünk, a kínai elsajátítása egy évig, a japán öt hónapig tartott. Az olasz, francia és spanyol nyelvek együttes feldolgozása már csak 3 hónapba került a gépi intelligenciának. A csehek előztek csak meg minket a régióban, a Google üzleti érdekei és a nyelvet beszélők száma alapján honosítja egyes szolgáltatásait.

Ha nem említettük volna, a szolgáltatás nem az eszköz helyi erőforrásait használja, hanem felküldi a digitalizált hangot a felhőbe, ahol a gyakorlatilag végtelen feldolgozási és tároló kapacitás dolgozza fel azt, és küldi vissza a már szövegé alakított tételt. Ezért működése valamennyire az aktuális sávszélességtől függ.

A gépi intelligencia egyébként folyvást fejlődik is, a hibákból is tanul. Ma a magyar szófelismerés  gyakorlatilag hibátlannak tekinthető.