Kézírásfelismerés
Még a "rovott múltamból" előhozakodok egy tanulságos esettel. A kilencvenes években kézírásfelismeréssel foglalkozó vállalkozásunk volt egy pár sráccal, úgyhogy behatóbban kellett foglalkoznom a számfelismerés mikéntjével, és lehetetlen voltával: a tökéletes és masszív információhiánnyal. Anno mi beszkennelt csekkekkel vergődtünk, 94% közeli felismerési pontossággal működött a rendszerünk, ami a gyakorlatban persze azt jelentette, hogy minden tizedik csekk garantáltan hibásan lett felismerve, de a közte lévő kilencre is rá kellett néznie embernek, mert ha nem...! Nem meglepő, hogy kézírást papírról mind a mai napig nem tudunk géppel felolvasni. De van más módszer, a tollacskás!
A kéziszámítógépek írásfelismerésének nem kell bonyolult elemzésekkel és pixelhibákkal vesződnie, mert a tollról egyenesen Bézier-görbék szakadnak le, a lehető legpontosabban leírva egy adott karaktert. A felismerés ennek ellenére nem megy olyan pontossággal, ami megütné a használhatóság mércéjét. Mi az a hatalmas gát, ami ilyen végtelenül megkönnyített helyzetben is megakadályozza, hogy egy felismerőrendszer az elvárásainknak megfelelően működjön? Vegyünk egy példát:
Vajon ezen az ábrán milyen számot látunk? A jó ég tudja. Vagy hatost, vagy nullát. Ki mondja meg, hogy a kettő közül melyiket? A szövegkörnyezet, csak a szövegkörnyezet. Ha megnézzük a környezetét, kiderül, hogy Ó betű :) Önmagában tehát ezen a jelen vergődni felesleges, de a felismeréshez találhatunk támpontot egy 10 cm sugarú körön belül. De nézzük ezt:
Ezt meg a földrajzi távolság és a kultúra bevonásával tudjuk helyesen értelmezni, anélkül egyáltalán nem. Ez Európában egyes, míg Amerikában hetes. Ha egy rendszernek megtanítod itthon, hogy ez egyes, Amerikában tévedni fog, és vica versa.
Ha pedig elszakadunk a számoktól, a szövegkörnyezet elemzése hihetetlen mennyiségű tudást igényel: nemcsak a beszélt nyelv változik iszonyatos sebességgel, de az írott is. Ezernyi példát tudnék még mutatni, de ezek már szépen mutatják, miért köt ki mindegyik gyártó ugyanott: tanuljon meg a felhasználó írni úgy, ahogy azt a gép el tudja olvasni. Ugyanakkor mégiscsak van egy olyan terület, ahol az AI jól jön, ahol nincs szükség kilencvenegynéhány százaléknál nagyobb találati arányra, és ahol a lekódolós-algoritmikus felismerés szóba sem jöhet, mert senki sem tudja az összefüggéseket: ez az adatbányászat. Majd egyszer arról is írok. Meg a mindenféle algoritmusokról.