Awesome
PrevLex – igekötős igék táblázata
A PrevLex a magyar igekötős igék jelenleg legbővebb, manuálisan ellenőrzött táblázata. A Magyar Nemzeti Szövegtár 2.0.4 (Oravecz et al. 2014) felhasználásával készült. Az igekötős finit igéken túl szerepelnek benne a korpuszban UNKNOWN-nak címkézett szavak és a hapaxok (egyszer előforduló szavak) is.
A PrevLex részletes ismertetéséhez ld. Kalivoda (2019).
Az erőforrás szerkezete
A PrevLex.txt egy TSV formátumú fájl, amely a következő oszlopokból áll:
- oszlop: igekötős igelemma, az igekötő és az ige + jellel elválasztva (ahol az igelemma bizonytalan, ott a két lehetséges igelemma | jellel elválasztva)
- oszlop: az igekötős ige tokengyakorisága az MNSZ 2.0.4-ben
- oszlop: kétféle érték állhat itt, attól függően, hogy az ige kapott-e megfelelő annotációt az MNSZ 2.0.4-ben (FIN, ha igen és UNKNOWN, ha nem)
- oszlop: azt jelzi, hogy az ige hány dokumentumban fordult elő
- oszlop: a normalizált alak, amely csak a neologizmusoknál térhet el az első oszlop tartalmától (pl. agyon+hypeol ⟶ agyon+hájpol)
Licensz
Felhasználható oktatási, kutatási és magáncélra. Felhasználása esetén az alábbi cikk hivatkozandó:
Kalivoda Ágnes (2019). Véges erőforrás végtelen sok igekötős igére. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.): XV. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2019). Szeged: Szegedi Tudományegyetem, TTIK, Informatikai Intézet. p. 331-344.
@inproceedings{kalivoda2019,
title = {V{\'e}ges er\H{o}forr{\'a}s v{\'e}gtelen sok igek\"{o}t\H{o}s ig{\'e}re},
booktitle = {XV. Magyar Sz{\'a}m{\'i}t{\'o}g{\'e}pes Nyelv{\'e}szeti Konferencia (MSZNY 2019)},
year = {2019},
pages = {331--344},
publisher = {Szegedi Tudom{\'a}nyegyetem, TTIK, Informatikai Int{\'e}zet},
organization = {Szegedi Tudom{\'a}nyegyetem, TTIK, Informatikai Int{\'e}zet},
address = {Szeged},
author = {Kalivoda, {\'A}gnes},
editor = {Berend, G{\'a}bor and Gosztolya, G{\'a}bor and Vincze, Veronika}
}