A tagset is a list of part-of-speech tags (POS tags for short), i.e. labels used to indicate the part of speech and sometimes also other grammatical categories (case, tense etc.) of each token in a text corpus.
Lithuanian part-of-speech tagset
This Lithuanian part-of-speech tagset is available in the Morphologically Annotated Lithuanian Corpus (MATAS) which was performed manually.
An Example of a tag in the CQL concordance search box: [tag="noun.*"]
finds all nouns, e.g. darbo, kartą, metais (note: please make sure that you use straight double quotation marks)
Category | Subcategory (English) | Subcategory (Lithuanian) | PoS Tag |
POS | noun | daiktavardis | dkt. |
adjective | būdvardis | bdv. | |
numeral | skaitvardis | sktv. | |
pronoun | įvardis | įv. | |
verb | veiksmažodis | vksm. | |
adverb | prievieksmis | prv. | |
interjection | jaustukas | jst. | |
onomatopoeia | ištiktukas | išt. | |
particle | dalelytė | dll. | |
preposition | prielinksnis | prl. | |
conjunction | jungtukas | jng. | |
acronym | akronimas | akronim. | |
abbreviation | sutrumpinimas | sutr. | |
Roman numbers | romėniški skaičiai | rom. sk. | |
stable phrases | stabiliosios frazės | idprl, idPS | |
residual | likę | nežinomas | |
Noun type | proper | Tikrinis | tikr. |
common | Bendrinis | ||
Verb | main | pagrindinis | |
infinitive | bendratis | bendr. | |
participle | dalyvis | dlv. | |
adverbial participle | padalyvis | pad. | |
half participle | pusdalyvis | pusd. | |
adverbial participle2 | būdinys | būdn. | |
Mood | indicative mood | tiesioginė nuosaka | tiesiog. n. |
imperative mood | liepiamoji nuosaka | liep. n. | |
subjective mood | tariamoji nuosaka | tar. n. | |
Numerals | cardinal | kiekinis | kiek. |
ordinal | kelintinis | kelint. | |
multiple | dauginis | daugin. | |
collective | kuopinis | kuopin. | |
Defineteness | pronominal | įvardžiuotinis | įvardž. |
non-pronominal | neįvardžiuotinis | neįvardž. | |
Reflexivity | reflexive | sangrąžinis | sngr. |
non-reflexive | nesangrąžinis | nesngr. | |
Voice | active | veikiamoji rūšis | veik. r. |
passive | neveikiamoji rūšis | neveik. r. | |
necessity | reikiamybės | reik. | |
Tense | present tense | esamasis laikas | es. l. |
past tense | būtasis kartinis laikas | būt. k. l. | |
past frequentative case | būtasis dažninis laikas | būt. d. l. | |
future tense | būsimasis laikas | būs. l. | |
simple past | būtasis laikas | būt. l. | |
Degree | positive | nelyginamasis laipsnis | nelygin. l. |
comparative | aukštesnysis laipsnis | aukšt. l. | |
superlative | aukščiausiasis laipsnis | aukšč. l. | |
Gender | feminine | moteriškoji giminė | mot. g. |
masculine | vyriškoji giminė | vyr. g. | |
neuter | bevardė giminė | bev. g. | |
common | bendroji giminė | bendr. g. | |
Number | singular | vienaskaita | vns. |
plural | daugiskaita | dgs. | |
dual | dviskaita | dvisk. | |
Case | nominative | vardininkas | V. |
genitive | kilmininkas | K. | |
dative | naudininkas | N. | |
accusative | galininkas | G. | |
instrumental | įnagininkas | Įn. | |
locative | vietininkas | Vt. | |
vocative | šauksmininkas | Š. | |
illiative | iliatyvas | Il. | |
Person | 1st | pirmasis asmuo | 1 asm. |
2nd | antrasis asmuo | 2 asm. | |
3rd | trečiasis asmuo | 3 asm. | |
Positive/negative | positive | teigiamas | teig. |
negative | neigiamas | neig. | |
Phrases | idprl. (pvz., be to), | stable phrases | |
idjngt. (pvz., ir kt.), | |||
idPS (p. s., taip žymimas junginio post scriptum sutrumpinimas) |
or