Awesome
PrevCons – igekötős igei hapaxok adatbázisa
A PrevCons (Preverb Constructions) egy nyílt hozzáférésű adatbázis, amely 21 038 igekötős hapaxot tartalmaz azok lehetséges vonzatkeretével együtt. Ezen felül számos metaadat érhető el benne a hapaxok morfológiai szerkezetéről, szemantikájáról és konkrét szövegbeli előfordulásáról. Az adatbázisról az oldal alján feltüntetett publikációk nyújtanak részletes tájékoztatást.
A PrevCons webes keresőfelület segítségével is böngészhető: https://aszalo.herokuapp.com/
A keresőfelületet Indig Balázs készítette.
Az erőforrás szerkezete
A PrevCons elérhető TSV fájlként (PrevCons.tsv
) és SQLite adatbázisként is (PrevCons.sqlite3
). Ezek pusztán a formátumukat tekintve térnek el egymástól, tartalmilag megegyeznek. A két formátumot az indokolja, hogy a számítógépes feldolgozáshoz praktikusabb lehet a TSV, a kézi adatelemzéshez pedig az SQLite-alapú megoldás. Az erőforrás 16 oszlopból áll, amelyek a következők:
-
id
: az igekötős ige egyedi azonosítója -
prev
: igekötő -
verb
: igelemma -
actform
: az igekötős ige szóalakja -
argframe
: az igekötős ige lehetséges (automatikus módszerrel kinyert) vonzatkerete -
prev_prod
: az igekötő terjeszkedő produktivitása (a PrevLex 2019/06/17-i verziója alapján) -
prev_hapaxes
: az igekötőt tartalmazó hapaxok darabszáma (a PrevLex 2019/06/17-i verziója alapján) -
inputtype
: az ige esetében azonosított szóalkotási mód -
suffixtype
: a képző vagy hangzásséma típusa -
phonotype
: amennyiben hangzássémába illeszkedik az ige, itt látható a teljes CV-séma -
style
: a forrásmondat stílusregisztere -
region
: a régió, amelyből a forrásmondat származik -
w2v_input
: az automatikus klaszterezés bemeneti szava (ide szóképzéssel létrejött ige esetében az alapszó kerül, pl. trollkodik ⟶ troll, hangzássémás ige esetében ugyanaz, mint az igelemma) -
w2v_cluster
: annak a klaszternek az azonosító száma, amelybe aw2v_input
mező szava került a szóbeágyazás során -
clause
: az a tagmondat, amely az igekötős igét tartalmazza -
sent
: a teljes mondat, amely az igekötős igét tartalmazza
Kiegészítő anyag
A PrevCons.sqlite3
fájl böngészéséhez az SQLite_útmutató.pdf
nyújt technikai segítséget.
Licensz
A PrevCons a GPL-3.0 licensz alá tartozik. Amennyiben felhasználja az adatbázist, kérem, hogy hivatkozza az alábbi publikációk egyikét:
Kalivoda Ágnes (2021). Az igekötők produktív kapcsolódási mintái. Argumentum 17. p. 56-82. https://doi.org/10.34103/ARGUMENTUM/2021/4
@article{kalivoda2021,
title = {Az igekötők produktív kapcsolódási mintái},
journal = {Argumentum},
volume = {17},
year = {2021},
pages = {56--82},
author = {Kalivoda, {\'A}gnes},
DOI = {https://doi.org/10.34103/ARGUMENTUM/2021/4}
}
Kalivoda Ágnes (2021). Igekötős szerkezetek a magyarban. Doktori értekezés. Pázmány Péter Katolikus Egyetem, Bölcsészet- és Társadalomtudományi Kar, Nyelvtudományi Doktori Iskola. Budapest. Megjelenés alatt.
@phdthesis{kalivoda2021,
address = {Budapest},
type = {Doktori értekezés},
title = {Igekötős szerkezetek a magyarban},
school = {Pázmány Péter Katolikus Egyetem, Bölcsészet- és Társadalomtudományi Kar, Nyelvtudományi Doktori Iskola},
author = {Kalivoda, {\'A}gnes},
year = {2021}
}