Mesterséges intelligencia IV.

Published 2009. 12. 04. by Admin in AI

Kézírásfelismerés

Még a "rovott múltamból" előhozakodok egy tanulságos esettel. A kilencvenes években kézírásfelismeréssel foglalkozó vállalkozásunk volt egy pár sráccal, úgyhogy behatóbban kellett foglalkoznom a számfelismerés mikéntjével, és lehetetlen voltával: a tökéletes és masszív információhiánnyal. Anno mi beszkennelt csekkekkel vergődtünk, 94% közeli felismerési pontossággal működött a rendszerünk, ami a gyakorlatban persze azt jelentette, hogy minden tizedik csekk garantáltan hibásan lett felismerve, de a közte lévő kilencre is rá kellett néznie embernek, mert ha nem...! Nem meglepő, hogy kézírást papírról mind a mai napig nem tudunk géppel felolvasni. De van más módszer, a tollacskás!

A kéziszámítógépek írásfelismerésének nem kell bonyolult elemzésekkel és pixelhibákkal vesződnie, mert a tollról egyenesen Bézier-görbék szakadnak le, a lehető legpontosabban leírva egy adott karaktert. A felismerés ennek ellenére nem megy olyan pontossággal, ami megütné a használhatóság mércéjét. Mi az a hatalmas gát, ami ilyen végtelenül megkönnyített helyzetben is megakadályozza, hogy egy felismerőrendszer az elvárásainknak megfelelően működjön? Vegyünk egy példát:
 

Vajon ezen az ábrán milyen számot látunk? A jó ég tudja. Vagy hatost, vagy nullát. Ki mondja meg, hogy a kettő közül melyiket? A szövegkörnyezet, csak a szövegkörnyezet. Ha megnézzük a környezetét, kiderül, hogy Ó betű :) Önmagában tehát ezen a jelen vergődni felesleges, de a felismeréshez találhatunk támpontot egy 10 cm sugarú körön belül. De nézzük ezt:
 

Ezt meg a földrajzi távolság és a kultúra bevonásával tudjuk helyesen értelmezni, anélkül egyáltalán nem. Ez Európában egyes, míg Amerikában hetes. Ha egy rendszernek megtanítod itthon, hogy ez egyes, Amerikában tévedni fog, és vica versa.

Ha pedig elszakadunk a számoktól, a szövegkörnyezet elemzése hihetetlen mennyiségű tudást igényel: nemcsak a beszélt nyelv változik iszonyatos sebességgel, de az írott is. Ezernyi példát tudnék még mutatni, de ezek már szépen mutatják, miért köt ki mindegyik gyártó ugyanott: tanuljon meg a felhasználó írni úgy, ahogy azt a gép el tudja olvasni. Ugyanakkor mégiscsak van egy olyan terület, ahol az AI jól jön, ahol nincs szükség kilencvenegynéhány százaléknál nagyobb találati arányra, és ahol a lekódolós-algoritmikus felismerés szóba sem jöhet, mert senki sem tudja az összefüggéseket: ez az adatbányászat. Majd egyszer arról is írok. Meg a mindenféle algoritmusokról.  

 


Megjegyzések

agysejt

2009. december 4. 16:04

agysejt

Az MI megközelítése is sokszor helytelen. Kitalálnak egy rendszert (pl. leprogramoznak), és azonnal eredményt várnak tőle...
Szerintem az a rendszer nem is MI ami egyből eredményt produkál. Az lesz az igazi MI ami kezdetben csak annyit tud mint egy csecsemő: felismerni a cicit és szopni.
Lehet hogy valaki már csinált igazi MI-t csak nem várt 10 évet, hogy kiderüljön? Smile

Egyszerű:
Az ember agya atomokból, molekulákból, elektronokból, elektromos jelekből, biokémiai folyamatokból áll.
Ha építünk egy MI-t, az is ilyesmikből fog állni. Szerintem egy tanuló rendszernek rengeteg időre van szüksége ahhoz, hogy összeálljon benne a "kép"!

Fóti Marcell Hungary

2009. december 5. 8:18

Fóti Marcell

Viszont ha az MI leélt már 30 évet, az agya kopizható lesz a következő generációkba, és többé nem kell leélnie X évet.

Megjegyzések lezárva

Hőskor. Az internet kora.

Az életnek nincs célja és nincs értelme. Az életnek szépsége van.