A tagset is a list of part-of-speech tags (POS tags for short), i.e. labels used to indicate the part of speech and sometimes also other grammatical categories (case, tense etc.) of each token in a text corpus.
Danish TaggerXML part-of-speech tagset is available in Danish corpora annotated by the Danish tagger tool CST’s TaggerXML developed by Centre for Language Technology at the University of Copenhagen
An Example of a tag in the CQL concordance search box: [tag=”V_GERUND”] searches all verb in gerund form, e.g. slutten, jobben (note: please make sure that you use straight double quotation marks)
Tagset overview
Tag | Part of speech | Example |
N_DEF_SING | substantiv, bestemt, singularis, | hyldeblomsten |
N_DEF_SING_GEN | substantiv, bestemt, singularis, genitiv | hyldeblomstens |
N_DEF_PLU | substantiv, bestemt, pluralis | hyldeblomsterne |
N_DEF_PLU_GEN | substantiv, bestemt, pluralis, genitiv | hyldeblomsternes |
N_INDEF_SING | substantiv, ubestemt | hyldeblomst |
N_INDEF_SING_GEN | substantiv, ubestemt, genitiv | hyldeblomsts |
N_INDEF_PLU | substantiv, ubestemt, pluralis | hyldeblomster |
N_INDEF_PLU_GEN | substantiv, ubestemt, pluralis, genitiv | hyldeblomsters |
N_SING | substantiv, singularis | messias |
N_SING_GEN | substantiv, singularis, genitiv | messias’s |
N_PLU | substantiv, pluralis | boligsøgende |
N | substantiv | rub, særdeleshed, zig-zag |
V_INF | verbum, infinitiv | samle |
V_PRES | verbum, præsens (nutid) | samler |
V_PAST | verbum, præteritum (datid) | samlede |
V_INF_PAS | verbum, infinitiv, passiv | samles |
V_PRES_PAS | verbum, præsens, passiv | samles |
V_PAST_PAS | verbum, præteritum, passiv | samledes |
V_PARTC_PAST | verbum, participium præteritum | samlet |
V_PARTC_PRES | verbum, participium præsens | samlende |
V_GERUND | verbum, gerundium | samlen |
V_IMP | verbum, imperativ | saml |
EGEN | proprium | Eddie |
EGEN_GEN | proprium, genitiv | Østrigs |
ADJ | almindeligt adjektiv | økonomiske |
ADV | adverbium | ud, ind, overfor |
NAMEX_ADV[1] | dato | 24.=maj=2005*DATE |
NUM | kardinal adjektiv | to |
NUM_ORD | ordinal adjektiv | 3. |
PRON_REC | reciprokt pronomen | hinanden |
PRON_REC_GEN | reciprokt pronomen, genitiv | hinandens |
PRON_DEMO | demonstrativ pronomen | den, det, de, denne, dette, disse |
PRON_DEMO_GEN | demonstrativ pronomen, genitiv | dennes, disses |
PRON_UBST | ubestemt pronomen | en, et, noget, man, noget, nogen anden, andet, andre |
PRON_UBST_GEN | ubestemt pronomen genitiv | ens, andres |
PRON_POSS | possessivt pronomen | min, din |
PRON_PERS | personligt pronomen | jeg, det, de, sig |
PRON_INTER_REL | interrogativt/relativt pronomen | hvem, hvad, hvilke |
PRON_INTER_REL_GEN | interrogativt/relativt pronomen genitiv | hvis |
PRÆP | præposition | i, ad, på |
UNIK | unik | som, der, at |
SKONJ | sideordnende konjunktion | og, men |
UKONJ | underordnende konjunktion | at, fordi, om, mens |
INTERJ | lydord/udråbsord | nå, ak, næh |
FORK | forkortelse | el., dr. |
TEGN | interpunktionstegn | ” , . – ; : ! ? ( ) |
FORM | formler | 1986:5, 16V, OX99-11 |
SYMBOL | symboler | $, *, § |
XX | andet | fejl mm. |
NO_CAT | Ord med tvivlsom kategori | Sparto, rabundus, adhoc |
Source: http://cst.dk/online/pos_tagger/rapport/bilag/tagset.html#_ftnref1