Awesome
AnaGramma-Parser
Egy pszicholingvisztikai indíttatású elemző modell
Részben vagy egészben történő felhasználás esetén az alábbi cikket kell meghivatkozni: Prószéky Gábor, Indig Balázs, Miháltz Márton, Sass Bálint: "Egy pszicholingvisztikai indíttatású számítógépes nyelvfeldolgozási modell felé" X. Magyar Számítógépes Nyelvészeti Konferencia MSzNy. 2014. január 16-17 (2014).
Függőségek:
- Python 3.5 (*Nix alapú rendszeren, preferáltan Linux)
- NLTK 3.0
- PurePOSPy (a megfelelő verzió szükséges)
- Humor morfológiai elemző REST API-n keresztüli eléréssel hasonlóan az emMorpPy-hez.
Használata:
- Két helyen a kódban meg kell adni a megfelelő elérésiutakat a PurePOS és a Humor REST API-hoz (ling_rules/morphology_converter/morphologyConverter.py:231 és engine/windowedMorphology.py:102)
- ./test.sh futtatásával a példamondatokon lefut a teszt a forráskódban definiált mondatokon.
Nyelvi szabályok:
A rendszer négy egymással konzisztens lépésre épül:
- A töbtagúnév esetek feldolgozása a szófaji egyértelműsítés után: ling_rules/mosaic.py
- Morfológia: Humor kód -> Elemző jellemzők konvertálása: ling_rules/morphology_converter/morphologyConverter.py
- Minták feldolgozása: Az egyes tokenek jellemzői definiálják a teendőiket (pl. dinamikus jellemzők, keresletek), amiket egy külön lépésben végrehajt a program: ling_rules/patternsAndActions.py
- A definiált keresők implementációi: A program futása során ezek a programrészletek futna le a keresők működése közben: ling_rules/mainActions.py
- (+1) Az igekötők és vonzatkeretek szótára külön fájlban kapott helyet: ling_rules/verbDictionary.py
Kapcsolódó modulok:
- Manócska: Integrált igei vonzatkerettár, mely az elemző vonzatkeret-szótáraként használható
- VFrame: Az igék vonztatkeret-lehetőségeinek leszűkítésére használt eljárás, beépítésre került az elemzőbe
- Nom-or-What: A morfológiai "nominatívusz" egyértelműsítésére szolgáló eljárás, beépítésre került az elemzőbe
- Whats wrong, Python?: Nyelvtechnológiai programok kimenetének és a kimenetek különbségeinek vizualizációjára is használható könyvtár (béta állapotú), felhasználható mint az elemző vizuális kimenete
- EmMorphPy: A Humor morfológiai elemzőhöz is használt REST API azóta továbbfejlesztett változata, az elemzőben a Humor REST API-ját szolgáltatja
- PurePOS: Szófaji egyértelműsítő, az elemzőben ideiglenesen került felhasználásra
- PurePOSPy: Python wrapper és REST API a PurePOS-hoz, az elemzőben ideiglenesen került felhasználásra
Technikai kérdésekkel kapcsolatban Indig Balázst (indig.balazs@itk) lehet keresni.