Home

Awesome

AnaGramma-Parser

Egy pszicholingvisztikai indíttatású elemző modell

Részben vagy egészben történő felhasználás esetén az alábbi cikket kell meghivatkozni: Prószéky Gábor, Indig Balázs, Miháltz Márton, Sass Bálint: "Egy pszicholingvisztikai indíttatású számítógépes nyelvfeldolgozási modell felé" X. Magyar Számítógépes Nyelvészeti Konferencia MSzNy. 2014. január 16-17 (2014).

Függőségek:

Használata:

  1. Két helyen a kódban meg kell adni a megfelelő elérésiutakat a PurePOS és a Humor REST API-hoz (ling_rules/morphology_converter/morphologyConverter.py:231 és engine/windowedMorphology.py:102)
  2. ./test.sh futtatásával a példamondatokon lefut a teszt a forráskódban definiált mondatokon.

Nyelvi szabályok:

A rendszer négy egymással konzisztens lépésre épül:

  1. A töbtagúnév esetek feldolgozása a szófaji egyértelműsítés után: ling_rules/mosaic.py
  2. Morfológia: Humor kód -> Elemző jellemzők konvertálása: ling_rules/morphology_converter/morphologyConverter.py
  3. Minták feldolgozása: Az egyes tokenek jellemzői definiálják a teendőiket (pl. dinamikus jellemzők, keresletek), amiket egy külön lépésben végrehajt a program: ling_rules/patternsAndActions.py
  4. A definiált keresők implementációi: A program futása során ezek a programrészletek futna le a keresők működése közben: ling_rules/mainActions.py
  5. (+1) Az igekötők és vonzatkeretek szótára külön fájlban kapott helyet: ling_rules/verbDictionary.py

Kapcsolódó modulok:

Technikai kérdésekkel kapcsolatban Indig Balázst (indig.balazs@itk) lehet keresni.