Széchenyi 2020

Elkészült az első publikus magyar kézírásfelismerő rendszer

Az Országos Széchényi Könyvtár Digitális Bölcsészeti Központja egy olyan mesterséges intelligencia alapú alkalmazást hozott létre és tett nyilvánossá, amely felismeri az emberi kézírást, és így nagy pontossággal képes az írott szöveget nyomtatott betűs szöveggé alakítani. Ez a program mindenki számára elérhető a Transkribus nevű szoftver komponenseként. 

Az írott szöveg felismerését egy mesterséges intelligencián alapuló algoritmus végzi, amelyet először be kellett tanítani, hogy a különböző kézírásokat felismerje. Ehhez a központ szakemberei Kiss József, a Hét című hetilap szerkesztőjének szakmai és személyes levelezését (kézírását) használták. A programban felhasznált kéziratok a Petőfi Irodalmi Múzeumban (PIM) találhatók, a tanulásra felhasznált szavak száma körülbelül 75 ezer. Közel 300 levél, borítékok, és egyéb – eredeti kézírást tartalmazó – anyagok kerültek feltöltésre a programba. A feltöltött dokumentumok megtekinthetők itt. 

Az alkalmazás a feltöltött minták alapján épített fel egy modellt, amellyel képes arra, hogy egy általa ismeretlen, még nem látott kézírásképet is értelmezzen. A program jelenleg 90%-os pontossággal működik, de ez változni fog, hiszen minél többféle anyagon tanul, minél több anyag kerül feltöltésre az adatbázisába, annál jobban fog teljesíteni a különböző szövegeken.  

Részletesebb leírást a programról itt találhat.

Ha szeretné kipróbálni a Transkribus programot, azt itt teheti meg.

Betöltés..