A tagset is a list of part-of-speech tags (POS tags for short), i.e. labels used to indicate the part of speech and sometimes also other grammatical categories (case, tense etc.) of each token in a text corpus.
MULTEXT-East Ukrainian part-of-speech tagset (version 6)
The MULTEXT-East Ukrainian part-of-speech tagset is used with Ukrainian corpora annotated by the RFTagger tool.
Therefore, the tag Vmeis-sm is to be interpreted, character by character, as follows:
V | Category | Verb |
m | Type | main |
e | aspect | perfective |
i | VForm | indicative |
s | tense | past |
– | person | indefinite |
s | number | s |
m | gender | masculine |
An Example of a tag in the CQL concordance search box: [tag=”Vmeis-sm”] finds words such as: сказав, відбувся, почав (note: please make sure that you use straight double quotation marks)
Basic overview of Ukrainian part-of-speech tagset
noun | N.* |
verb | V.* |
adjective | A.* |
pronoun | P.* |
adverb | R.* |
adposition | S.* |
conjunction | C.* |
numeral | M.* |
particle | Q.* |
interjection | I.* |
abbreviation | Y |
residual | X |
punctuation | Z |
Ukrainian part-of-speech tagset in detail
Specification for nouns
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Noun | N | частина_мови | Іменник |
1 | Type | common | c | тип | загальний |
proper | p | власна_назва | |||
2 | Gender | masculine | m | рід | чоловічий |
feminine | f | жіночий | |||
neuter | n | середній | |||
common | c | загальний | |||
3 | Number | singular | s | число | однина |
plural | p | множина | |||
4 | Case | nominative | n | відмінок | називний |
genitive | g | родовий | |||
dative | d | давальний | |||
accusative | a | знахідний | |||
instrumental | i | орудний | |||
locative | l | місцевий | |||
vocative | v | кличний | |||
5 | Animate | no | n | істота | ні |
yes | y | так |
- Ukrainian pluralia tantum nouns are not encoded directly but can be identified by the absence of a value of Gender (“-“).
- The Gender value “common” is assigned to nouns that can combine with adjectives in either feminine or masculine,e.g. сирота or either neutral or masculine gender, e.g. Самоа.
Specification for verbs
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Verb | V | частина_мови | Дієслово |
1 | Type | main | m | тип | основне |
auxiliary | a | допоміжне | |||
2 | Aspect | progressive | p | вид | недоконаний |
perfective | e | доконаний | |||
biaspectual | b | двовидове | |||
3 | VForm | indicative | i | форма | дійсна |
imperative | m | наказова | |||
infinitive | n | неозначена | |||
impersonal | o | безособова | |||
gerund | g | дієприслівник | |||
4 | Tense | present | p | час | теперішній |
future | f | майбутній | |||
past | s | минулий | |||
5 | Person | first | 1 | особа | перша |
second | 2 | друга | |||
third | 3 | третя | |||
6 | Number | singular | s | число | однина |
plural | p | множина | |||
7 | Gender | masculine | m | рід | чоловічий |
feminine | f | жіночий | |||
neuter | n | середній |
- Gerunds are not differentiated, but could be treated as a special class of nouns, nota bene: they possess aspect.
- No voice for Ukrainian as all verbal forms are active (adjectival/attributive participles are treated as adjectives).
- The impersonal VForm (o) is characterized by the ending -то/-но. It exists in other Slavic languages as well, although in most of them it coincides with the neutral form of the passive adjectival participle and is classified as such. In Ukrainian, as well as in Polish, the attributive form is different from the predicative one, cf. in Ukrainian писане правило (a written rule) vs писано правило (a rule was/is written).
Specification for adjectives
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Adjective | A | частина_мови | Прикметник |
1 | Type | qualificative | f | тип | якісний |
ordinal | o | відносний | |||
participle | p | дієприкметник | |||
2 | Degree | positive | p | ступінь | основний |
comparative | c | вищий | |||
superlative | s | найвищий | |||
3 | Gender | masculine | m | рід | чоловічий |
feminine | f | жіночий | |||
neuter | n | середній | |||
common | c | загальний | |||
4 | Number | singular | s | число | однина |
plural | p | множина | |||
5 | Case | nominative | n | відмінок | називний |
genitive | g | родовий | |||
dative | d | давальний | |||
accusative | a | знахідний | |||
instrumental | i | орудний | |||
locative | l | місцевий | |||
6 | Definiteness | short-art | s | форма | стягнена |
full-art | f | нестягнена | |||
7 | Animate | no | n | істота | ні |
yes | y | так | |||
8 | Aspect | progressive | p | вид | недоконаний |
perfective | e | доконаний | |||
biaspectual | b | двовидове | |||
9 | Voice | active | a | стан | активний |
passive | p | пасивний | |||
10 | Tense | present | p | час | теперішній |
past | s | минулий |
- Relative adjectives (Ukr. відносні прикметники) are here labelled “o(rdinal)” for the sake of continuity with the Slovene tagset, where this term translates Slovene vrstni (pridevniki).
- The feature “Animate” is used to differentiate between two accusative masculine forms.
- Adjectival participles are grouped with adjectives and are characterized by voice, quasi-tense and aspect.
- NB: Although active adjectival participles are considered ungrammatical, being a consequence of russification, they still can be found in the language use. Thus, they are not generated by the Ukrainian grammatical dictionary but codes for them are foreseen in the UGTag and the present MSD index.
Specification for pronous
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Pronoun | P | частина_мови | Займенник |
1 | Type | personal | p | тип | особовий |
demonstrative | d | вказівний | |||
indefinite | i | неозначений | |||
possessive | s | присвійний | |||
interrogative | q | питальний | |||
relative | r | відносний | |||
reflexive | x | зворотній | |||
negative | z | заперечний | |||
general | g | загальний | |||
emphatic | h | наголошений | |||
2 | Referent_Type | possessive | s | додатковий_тип | присвійний |
3 | Person | first | 1 | особа | перша |
second | 2 | друга | |||
third | 3 | третя | |||
4 | Gender | masculine | m | рід | чоловічий |
feminine | f | жіночий | |||
neuter | n | середній | |||
5 | Animate | yes | y | істота | так |
no | n | ні | |||
6 | Number | singular | s | число | однина |
plural | p | множина | |||
7 | Case | nominative | n | відмінок | називний |
genitive | g | родовий | |||
dative | d | давальний | |||
accusative | a | знахідний | |||
instrumental | i | орудний | |||
locative | l | місцевий | |||
8 | Syntactic_Type | nominal | n | синтактичний_тип | іменник |
adjectival | a | прикметник | |||
adverbial | r | прислівник |
- Many pronouns can be assigned to more than one Type. The Referent_Type feature is used to show the additional feature, like possessiveness or personality. The main type is defined according to the grammatical tradition. Note: there is no PRONOUN as POS in the Ukrainian Grammatical Dictionary, pro-nouns are a class of nouns. The Syntactic_Type shows further POS distribution.
- The emp(h)atic Type of Pronoun is used for pronoun forms ні”кому, ні”чому, ні”чим, ні”кого, etc., with complex meanings like “there is nobody/nothing (to do sth/to use for doing sth, etc.)”. Orthographically these are identical forms of negative nominal pronouns ніхто, ніщо “nobody, nothing” in oblique cases, however, with differing accent. They are referred to as either separate pronoun lexemes or predicatives in grammars. All Ukrainian emphatic pronoun forms include negation.
Specification for adverbs
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Adverb | R | частина_мови | Прислівник |
1 | Degree | positive | p | ступінь | основний |
comparative | c | вищий | |||
superlative | s | найвищий |
Specification for adpositions
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Adposition | S | частина_мови | Прийменник |
1 | Type | preposition | p | тип | прийменник |
2 | Formation | simple | s | форма | простий |
compound | c | складений | |||
3 | Case | genitive | g | відмінок | родовий |
dative | d | давальний | |||
accusative | a | знахідний | |||
instrumental | i | орудний | |||
locative | l | місцевий |
Specification for conjunctions
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Conjunction | C | частина_мови | Сполучник |
1 | Type | coordinating | c | тип | сурядний |
subordinating | s | підрядний | |||
2 | Formation | simple | s | форма | простий |
compound | c | складений |
Specification for numerals
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Numeral | M | частина_мови | Числівник |
1 | Form | digit | d | форма | цифра |
roman | r | римська | |||
letter | l | літера | |||
2 | Type | cardinal | c | тип | кількісний |
ordinal | o | порядковий | |||
3 | Gender | masculine | m | рід | чоловічий |
feminine | f | жіночий | |||
neuter | n | середній | |||
4 | Number | singular | s | число | однина |
plural | p | множина | |||
5 | Case | nominative | n | відмінок | називний |
genitive | g | родовий | |||
dative | d | давальний | |||
accusative | a | знахідний | |||
instrumental | i | орудний | |||
locative | l | місцевий | |||
6 | Animate | no | n | істота | ні |
yes | y | так |
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Particle | Q | частина_мови | Частка |
Specification for interjections
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Interjection | I | частина_мови | Вигук |
Specification for abbreviations
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Abbreviation | Y | частина_мови | Скорочення |
Specification for residual
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Residual | X | частина_мови | Залишок |
Specification for punctuation
P | Attribute (en) | Value (en) | Code (en) | Attribute (uk) | Value (uk) |
0 | CATEGORY | Punctuation | X | частина_мови | Пунктуація |
(This content of this page was taken from https://nl.ijs.si/ME/V6/msd/html/msd-uk.html CC BY-SA 4.0)