Az NLP célja a természetes nyelvek kisebb egységekre bontása, majd az egységek közötti kapcsolatok, összefüggések feltárása. Minél több adat (szöveg) áll rendelkezésre, annál könnyebb megtalálni az összefüggéseket az adatok között, vagyis annál pontosabb képet kaphatunk magáról a nyelvről.
A HILANCO egy természetes nyelvi feldolgozó konzorcium Magyarországon, amelyet a Magyar Nyelvtudományi Kutatóközpont (NYTK), a Pécsi Tudományegyetem, valamint az Alkalmazott Adattudományi és Művészeti Intelligencia Központ (PTE) hozott létre. A konzorcium küldetése, hogy új NLP technológiákat és erőforrásokat biztosítson az intelligens nyelvi alkalmazások mesterséges intelligencia célokra történő létrehozásához. Minőségi megoldásokat kínálnak a kutatástól és fejlesztéstől a piacképes üzleti termékekig. Új perspektívákat nyitnak meg a kutatási területeken, és fejlesztéseik rendkívül hasznosak lehetnek az új chatbotok, virtuális asszisztensek és párbeszédügynökök létrehozásában.
- Hilanco-GPTX: Magyar nyelvi GPT modell tesztelése
A GPT-3 a Generative Pre-Training Transformer 3 angol kifejezés rövidítése. Ez egy autoregresszív nyelvi modell, amely a deep learninget (mélytanulási módszert) használja az emberi íráshoz hasonló szöveg előállításához. A GPT-3 előnye, hogy olyan jó minőségű szövegeket generál, hogy azt nehéz megkülönböztetni az ember által írtaktól. Ez az NLP (Natural Language Processing) modell képes számítógépes kódot, vagy akár költészeti alkotást is írni, létrehozni.
Magyar nyelvi GPT program kipróbálása
A gépi fordítóprogramok reneszánszukat élik napjainkban. A fejlesztés alkalmas arra, hogy a programba illesztett szöveget lefordítsa (magyarról angolra, vagy fordítva). Emellett a „multi” funkció segítségével kiválaszthatunk más forrásnyelveket is, amelyekről a program a magyarra tud fordítani.
Fordító program kipróbálása
A kivonatoló program azzal a céllal került fejlesztésre, hogy hosszabb szövegből egy-egy mondatos kivonatot készítsen, kiemelve a szöveg lényegét, illetve legjelentősebb mondatát.
Kivonatoló program kipróbálása
A mesterséges intelligencia alapú fejlesztés képes arra, hogy a beillesztett szöveg érzelmi töltetét meghatározza. Egy ilyen program segítségével a szöveg hangulatát anélkül is meghatározhatjuk, hogy azt végig olvassuk, így nagy jelentősége van hírek, postok negatív, pozitív, illetve semleges kategorizálására.
Érzelmeket felismerő program kipróbálása
A névfelismerő program célja a nevek felismerése, anonimizálása a megadott szövegben.
Neveket felismerő program kipróbálása
- Címkéző: szöveg címkézése
Az internetes cikkek, hírek alatt találhatunk címkéket, amelyek segítenek az olvasónak a szöveg témakörének mielőbbi beazonosításában. A címkéző alkalmazás célja az, hogy a programba bemásolt szöveget elemezve olyan címkéket ajánljon a felhasználónak, amelyet fel tud használni a saját honlapján megjelentetésre szánt szöveg témájának behatárolásában.
Szövegcímkéző kipróbálása
- Ékezet-visszaállító: ékezetmentes szövegből ékezetes szöveget készít
A fejlesztés alkalmas arra, hogy a bemásolt szöveget átvizsgálva helyreállítsa az ékezeteket.
Ékezeteket visszaállító program kipróbálása
Ez a fejlesztés a már említett GPT-3 nyelvi modell előző verziója.
Korábbi magyar nyelvi program kipróbálása