A tagset is a list of part-of-speech tags (POS tags for short), i.e. labels used to indicate the part of speech and sometimes also other grammatical categories (case, tense etc.) of each token in a text corpus.
Portuguese VISL (Visual Interactive Syntax Learning) symbol set is available in Portuguese corpora annotated by the Palavras parser.
TreeTagger for Portuguese with Pablo Gamallo TAGSET 11 tags simples
(copied from http://gramatica.usc.es/~gamallo/tagger/tagset.rtf in due to creating deposit)
Pablo Gamallo TAGSET 11 tags simples | |
Adjectivo | ADJ |
Advérbio | ADV |
Determinante | DET |
Número Cardinal / Ordinal | CARD |
Nome Comum / Próprio | NOM |
Pronome | P |
Preposição | PREP |
Verbo | V |
Interjeição | I |
Separadores dentro da oraçao | VIRG |
Separadores de oraçoes | SENT |
Existem tambem cominaçoes de tags:
PREP+DET (por exemplo: “do”, “das”, etc.)
V+P (por exemplo: “levou-me”, “disse-lhe”, etc.)
Adjective: ADJ
Adverb: ADV
Determinant: DET
Cardinal or Ordinal: CARD
(common or proper) Noun: NOM
Pronoun: P
Preposition: PREP
Verb: V
Interjection: I
puctuation marks within the phrase: VIRG *
puctuation marks between phrases: SENT
Moreover, there are combinations of tags:
PREP+DET (for instance: “do”, “das”, etc.)
V+P (for instance: “levou-me”, “disse-lhe”, etc.)
An Example of a tag in the CQL concordance search box: [tag="n|N.*"]
finds all nouns e.g. árvores , oitavo (note: please make sure that you use straight double quotation marks)
For an alphabetical list of syntactic Constraint Grammar tags used in the Palavras parser, as well as some frequency statistics and more secondary valency tags, cf. The Palavras CG symbol set.
In the following symbol tables, VISL constituent tags are red, CG dependency tags are blue. In VISL notation, function symbols begin with upper case letters (e.g. Od = direct object), form symbols with lower case letters (e.g. pron = pronoun). In CG notation, all primary categories are in upper case letters, function tags have a ‘@’, form tags have not. CG function tags may have dependency markers pointing left (<) or right (>) to the dependency head. At clause level, heads are verbs and not specified in the symbols. At group level, heads are specified at the arrow head, function at the arrow base, e.g. @N
In the examples, the exemplified constituent is in red, its head, i.e. the word carrying the CG tag for the constituent as a whole, is underlined.
Clause level arguments (valency governed)
symbol | category | examples |
S @SUBJ> @<subj< span=””> |
subject sujeito subjekt |
Ninguém gosta de chuva Retomar o controle foi difícil. A cidade era toda de vidro. Seja quem for. Tem gente morrendo de fome no Brasil. Fugiram do zôo um hipopótamo e um crocodilo. |
@SUBJ>> | pre-matrix verb subject | Nunca o vi jogar futebol. As inspecções, recorde-se, começaram em Abril |
Od, Oacc @ACC> @<acc< span=””> |
direct (accusative) object objeto direto (acusativo) direkte (akkusativ) objekt |
Liga a luz! Para combater as doenças do inverno, come vitaminos. Não tem onde morar. Sempre come um monte de folhas. |
@ACC>> | pre-matrix verb object | ela se deixou levar. .., o que é quase dispensável a dizer |
@ACC>-PASS @<acc-pass< span=””> |
passive ‘se’-construction | |
Oi, Odat @DAT> @<dat< span=””> |
dative object objeto indireto pronominal indirekte (dativ) objekt |
Lhe dou um presente. Preste-me a sua caneta, por favor! Me mostre seu hipopótamo! |
Op, Opiv @PIV> @<piv< span=””> |
prepositional object objeto preposicional preæpositionsobjekt |
Não me lembro dele. Falamos sobre a sua proposta. Gostava muito de passear ao longo do rio. Não sabe de nada. Pode contar comigo. Chamamos de objeto preposicional complementos indiretos não substituíveis por pronomes adverbiais. |
As @ADVS> @<advs< span=””> Ao @ADVO> @<advo< span=””> |
argument adverbial complemento adverbial adverbialargument [can be substituted by adverbial pronoun, valency bound, unlike adjuncts] |
Durava muito tempo. (As) A vase caiu no chao. (As) Não mora mais aqui. Mora em São Paulo. (As) Voltamos ao nosso assunto. (As) Mandaram-nos para Londres. (Ao) Costuma custar mais de mil coroas. (As) |
Cs @SC> @<sc< span=””> |
subject complement predicativo do sujeito subjektsprædikat(iv) |
Está doente. Está com febre. A moça parece muito cansada. Nadava nua no mar. Andava zangado todo dia. |
Co @OC> @<oc< span=””> |
object complement predicativo do objeto objektsprædikat(iv) |
O acho muito chato. Tê-lo feito de propósito o faz um delito. |
P | predicator predicador preædikator |
Hipopótamo come folhas. Hipopótamo tem que dormir muito. |
Vm @FMV @IMV |
main verb verbo principal hovedverbum |
Bebe muita cerveja. Todo dia mandava (1) o filho comprar (2) leite. Hipopótamo temque dormirmuito. |
Vaux @FAUX @IAUX |
auxiliary verbo auxiliar hjælpeverbum |
A interface foi feito por uma equipe da WinSoft. Estou lendo um romance português. Hipopótamo tem que dormir muito. |
@NPHR | top node noun phrase (especially headlines) |
Clinton ainda no poder |
@ADVL | top node adverbial (especially headlines) |
Seis milhões em dez anos |
FMV, IMV, FAUX, IAUX, AUX<:
In CG-analysis, predicator groups are denoted implicitly, as verb chains, which is why a distinction is made between @F… (finite) and @I… (non-finite), and why all but the first verb in a chain will have an additional @#ICL-AUX< tag (non-finite complement of auxiliary). Verb chain particles are tagged @PRT-AUX<. The first verb in a chain can be finite (@FAUX), all others have to be non-finite. The last verb in a chain is the main verb (@IMV), the others are auxiliaries (@FAUX, @IAUX). For instance:
A interface tem @FAUX sido @IAUX @#ICL-AUX< feito @IMV @#ICL-AUX< pela WinSoft.
Ele tem @FAUX que @PRT-AUX< dormir @IMV @#ICL-AUX< muito.
Clause level adjuncts (not valency governed)
symbol | category | examples |
fA @ADVL> @<advl< span=””> |
adjunct adverbial adjunto adverbial adverbialadjunkt |
Sempre comiam cedo. As crianças jogavam no parque. Feito o trabalho temos tempo para mais uma cerveja. Entraram na vila quando amanheceu. O outro dia fugiu do zôo um hipopótamo. |
@ADVL>AS< | adjunct adverbial in averbal clause | …, ainda que agora de pouco valor |
fC @PRED> @<pred< span=””> |
adjunct predicative adjunto predicativo prædikativadjunkt |
Sempre nada nua. Cansado, se retirou. |
fApass @<pass< span=””> |
passive adjunct adjunto do passivo passivadjunkt |
Era o herói do dia e foi elogiado pelo chefe do jardim zoológico. |
fCsta @S< |
statement predicative (sentence apposition) aposto da oração sætningsprædikativ |
Morreu o cachorro da velha, o que muito a entristece. |
@>S | complementizer adject | Só quando ele lhe surge na frente, se compenetra que era mesmo verdade |
fCvoc @VOK |
vocative adjunct constituinte vocativo vokativadjunkt |
Me ajuda, Pedro! |
FOC @FOC> @<foc< span=””> |
focus marker marcador de foco fokusmarker |
É a dançar que ela se entende. (focus bracket) Foi de sua música que gostei. (focus bracket) Gosta é de briga. |
TOP @TOP |
topic constituent constituinte de tópico topic-konstituent |
A Maria, não quero convidá-la. (object topic) Esse rapaz, ele sabe dançar. (subject topic) |
Subordination and coordination (function)
symbol | category | examples | |
SUB @SUB |
subordinator subordinador subordinator |
Acho que um jardim zoológico sem hipopótamos não merece subsídios. | |
SUBcom @COM |
comparative subordinator subordinador comparativo komparator |
Esta fofoqueira fala como uma cachoeira. | |
SUBprd @PRD | predicative subordinator (role complementizer) subordinador predicativo rolleindleder |
Trabalha como guía. | |
SUBaux @PRT-AUX< |
auxiliary subordinator subordinador auxiliar (partículo auxiliar) auxiliarpartikel |
Voltou a molestá-la no escritório. O outro ano acabou de ensinar inglês. Hipopótamo tem que dormir muito. |
|
@#ICL-AUX< (not as simple @) |
auxiliary complement complemento auxiliar auxiliarkomplement |
Hipopótamo tem que dormir muito. | |
SUB< @AS< |
[averbal] clause body tronco de oração [averbal] sætningsstamme (indlederkomplement) |
Quando em Roma, faça como os romanos. | |
CO @CO |
coordinator coordenador koordinator |
Fugiram do zôo um hipopótamo e um crocodilo. | |
CJT | conjunct (elemento) conjunto konjunkt |
Fugiram do zôo um hipopótamo e um crocodilo. |
In a CG analysis, co-ordinated conjuncts are both tagged for clause level or group level function (i.e. the same function), not as CJT. The co-ordinated unit (cu) is thus not specified directly in CG. However, the relevant information can be derived from the conjuncts identical function tags, and (in the full version of the parser) from a co-ordinating tag on the co-ordinating conjunction. For instance:
Fugiram do zôo um hipopótamo @e @CO um crocodilo @<subj.< p=””>
Group level constituent function
symbol | category | examples | |
H – D | head <-> dependent núcleo <-> dependente hoved <-> dependent |
uma grande árvore sem dinheiro devagar demais |
|
D | DN DNmod DNarg @>N, @N< |
adnominal adject adjeto adnominal adnominaladjekt (H: noun or pronoun) |
o (1) seu (2) grande (3) carro novo (4) (modifiers) a (1) mulher do amigo (2) (modifiers) um tanto (modifier) cacique Jerônimo (modifier) Manoel Neto (1) da Silva (2) (modifiers) a proposta de lhe ajudar (argument) combinaram a venda da casa. (argument) predisposição para diabete (argument) |
DNapp @APP |
(adnominal) apposition aposição (do substantivo) [epíteto de identidade] (nominal-) apposition |
O grande cacique, Jerônimo, conhecia o seu país como mais ninguém. | |
DNc @N<pred< span=””> |
predicative adject adjeto predicativo [epíteto predicativo] preædikativadjekt |
Jerônimo, um grande cacique, temia ninguém. com a mão na bolsa |
|
DA DAmod DAarg @>A, @A< |
adverbial adject adjeto adverbial adverbialadjekt (H: adjective, adverb or determiner) |
muito devagar (modifier) devagar demais (modifier) rico em ouro (argument) receoso de lhe ter ofendido (argument) |
|
@ADVL>A @A<advl< span=””> @A<adv< span=””> @A<pass< span=””> @A<piv< span=””> @A<sc< span=””> |
functions in postnominal participal “clause” |
o número de famílias já (ADVL>A) abrangidas pelo projecto (A<pass)< span=””> um equipamento periférico denominado “Audioman” (A<sc)< span=””> um período destinado a testar a aplicação (A<piv)< span=””> uma discoteca situada em Albufeira (A<adv)< span=””> |
|
@NUM< | numeral chain constituent | de 1 a 9 de Junho passado a criação de 30 mil a 50 mil postos de emprego |
|
DAcom @KOMP< |
argument of comparative complemento comparativo komparativkomplement |
é mais bonito do que um hipopótamo. | |
DP DParg DPmod @P<, @>P |
argument of preposition argumento de preposição præpositionsargument [styrelse] |
sem dinheiro nenhum (argument) quase sem dinheiro (modifier) |
|
Dfoc | focus dependent dependente focalizardor fokus dependent |
Até o rei gostava da peça. Comeu nem a sobremesa. |
Utterance function
symbol | category | examples | |
UTT | STA QUE COM EXC |
utterance enunciado ytring |
Não faz nada. [statement] Já vás embora? [question] Espera! [command] Pobre de mim! [exclamation] |
STA | statement enunciado declarativo udsagn |
A terra é redonda. Gosta muito de elefantes. Sua vez. Às sete. Obrigado. |
|
QUE | question enunciado interrogativo spørgsmål |
Quem quer uma cerveja? Já ligou para o ministério? Quando? |
|
COM | command enunciado imperativo ordre |
Pára com isso! Venha pra cá! Fora! |
|
EXC | exclamation enunciado exclamativo udråb |
Deus! Que beleza! Quanta gente! |
Group forms
symbol | category | examples | |
np | np propp pronp |
noun phrase sintagma nominal nominalsyntagme (H: noun or pronoun) |
Era um homem como um forte. (np) A velha avó dormia na rede. (np) Vou fazê-lo eu mesmo. (pronp) O seu nome era Mário Moreno dos Santos. (propp) |
ap | adjp advp detp |
adpositional phrase sintagma adposicional adpositionssyntagme (H: adjective, adverb or determiner) |
As árvores no jardim eram muitovelhas. (adjp) Foi um presidente um poucoiconoclasta. (adjp) Nesta saia, parece mais jovem do que as amigas. (adjp) Costuma falar muito devagar. (advp) Ainda hoje vivem de caça e pesca. (advp) Era muito mais vinho do que imaginava. (detp) |
vp | verb phrase sintagma verbal verbalsyntagme (H: main verb [semantically] or auxiliary [dependency grammar]) |
Ele continua mexendo nas tarefas dos outros.Vem de lhes propor um acordo.
Temos que dar-lhe mais dinheiro. |
|
pp | prepositional phrase sintagma preposicional præpositionssyntagme (H: prepostion) |
Abriu a janela da sala Gostou do que viu. Pedro da Silva Mudamos para São Paulo. |
Clause forms and parataxis
symbol | category | examples | |
cl | fcl @#FS-… |
finite (sub)clause oração finita finit (led)sætning |
Não acredito que seja verdade |
icl @#ICL-… |
non-finite (sub)clause oração infinita infinit (led)sætning |
Consertar um relógio não pode ser fácil | |
acl @#AS-… |
averbal (sub)clause oração averbal averbal (led)sætning |
Ajudou onde possível | |
cu | compound unit paratagma paratagme |
ver Roma e viver a história era o seu sonho. |
In a CG analysis, the FCL, ICL and ACL clause form tags are marked @# (as opposed for non-clausal tags, @), and combined with ordinary function tags. ‘@#FS-<acc’, for=”” instance=”” is=”” a=”” direct=”” object=”” clause,=”” @#icl-advl=””> is an adverbial clause. Finite clause tags (@#FS) and averbal (@#AS) are attached to the conjunction, relative or interrogative heading the clause, non-finite (@#ICL) clause tags are attached to the first (non-finite) verb in the clause. In bothe cases the @# tag stands alongside the word’s “clause-internal” function tag (@-tag). For instance:
Não acredito que @SUB @#FS-seja verdade
Consertar @IMV @#ICL-SUBJ> um relógio não pode ser fácil
Ajudou onde @ADVL> @#AS-possível
Word classes (morphological form)
symbol | category | examples | ||
n N |
noun nome substantiv (nomen) |
árvores n(F P) um oitavo n( M S) |
||
prop PROP |
proper noun nome próprio proprium (egenavn) |
Estados=Unidos prop(M P) Dinamarca prop(F S) |
||
adj ADJ |
adjective adjetivo adjektiv |
belas adj(F P) terceiros adj( M P) |
||
v V |
v-fin VFIN |
finite verb verbo finito finit verbum (bøjet i tid) |
fizessem v-fin(IMPF 3P SUBJ) | |
v-inf INF |
infinitive infinitivo infinitiv |
fazermos v-inf(1P) | ||
v-pcp PCP |
participle particípio participium |
comprados v-pcp(M P) [attributive] tem comprado v-pcp [verbal] |
||
v-ger GER |
gerund gerúndio gerundium |
correndo v-ger | ||
art DET DET |
article artigo artikel |
os membros art( M P) [definite] uma criança art( F S) [indefinite] |
||
pron | pron-pers PERS |
personal pronoun pronome pessoal personligt pronomen |
mim pron-pers(1S PIV) tu pron-pers(2S NOM) |
|
pron-det DET |
determiner pronoun pronome determinativo determinativt pronomen (adjektivisk pronomen) |
estas pron-det( F P) [demonstrative] muita pron-det( F S) [indefinite] cujos pron-det( M P) [relative] quantos pron-det( M P) [interrogative] minhas pron-det( F P) [possessive] |
||
pron-indp SPEC |
independent pronoun pronome independente independent pronomen (substantivisk pronomen) |
isto pron-indp( M S) [demonstrative] algo, nada pron-indp( M S) [indefinite] os=quais pron-indp( M P) [relative] quem pron-indp( M S) [interrogative] |
||
adv ADV |
adverb advérbio adverbium |
facilmente, devagar adv [modals] aqui, lá adv [pronominals] muito, imensamente adv[intensifiers] onde, quando, como adv[relatives, interrogatives] não, até, já adv [operators] |
||
num NUM |
numeral numeral numeralia |
duas num(F P) 17 num ( M/F P) |
||
prp PRP |
presposition preposição preposition |
contra prp em=vez=de prp |
||
intj IN |
interjection interjeição interjektion |
oi! in | ||
conj | conj-s KS |
subordinating conjunction conjunção subordinativa underordnende konjunktion |
que conj-s embora conj-s |
|
conj-c KC |
coordinating conjunction conjunção coordenativa sideordnende konjunktion |
e conj-c ou conj-c |
||
pu (unused) | punctuation pontuação tegnsætningstegn |
,pu [komma] |
Inflexion potential of inflecting word classes
noun | ||||||
proper noun | ||||||
adjective | ||||||
pronoun
personal (PERS)
|
||||||
determiner (DET)
|
||||||
independent (SPEC)
|
||||||
verb
finite (VFIN)
|
||||||
infinitive (INF)
|
||||||
past participle (PCP)
|
+ = inflects (word form category), +* = lexeme category
Secondary tags (<>) in CG corpus annotation
definite article | DET | |
indefifnite article | DET | |
, cf. | cardinal number | NUM |
*, , , , , , , , , , , , , , , , | what a co-ordinator co-ordinates (used internally for tree-generation) @ACC, @ADVL, @APP, @DAT, main clauses, GER, INF, @OC, PCP-@IMV, @A<, @N<, @PRED, @>N, @P<, @SC, @SUBJ, VFIN |
KC |
demonstrative | DET, SPEC | |
derivation by prefixation | N, ADJ, V, ADV | |
derivation by suffixation | N, ADJ, V, ADV | |
determiner usage/inflection of adverb | ela estava toda nua | |
differentiator | DET (o mesmo, o outro) | |
* | finite main clause (used internally for tree-generation) | VFIN –> @FMV @#FS-STA (statement) |
* | focus marker (redundant –> @FOC) | ADV (eis, eis=que, é=que, foi … que, é) |
hyphenated word (left-marked) | acreditá-lo –> ‘acreditar’ V + ‘o’ PERS | |
identifier | DET (ele mesmo, ele próprio) | |
, cf. | interrogative | DET (quanto, que), SPEC (quem, o=que), ADV (onde, porquê) |
* (not disambiguated) | can be used as “conjuntional adverb” | ADV (pois, entretanto, mais) |
comparative “hook” (for @KOMP<) | DET, ADV (mais, menos, pior, tal, mesmo) | |
, cf. | used like a “subordinating conjunction” | ADV (como, onde, quando) |
, cf. | ordinal number (subclass of adjective) | ADJ (terceiro, quinto) |
, , , , | possessive | DET |
other word class used as “proper noun”, i.e. with capital initial | N, ADJ, PCP | |
, cf. | used like a “preposition” | ADV (como, onde, quando) |
quantifier (indefinite) | DET, SPEC | |
, cf. | reflexive | PERS (se, me, te, nos, vos, si) |
, cf. | relative | DET (cujo), SPEC (quem, que, o=qual), ADV (onde, quando, como) |
1. part in contracted word | nisto –> em | |
<-sam> | 2. part in contracted word | nisto –> isto |
, cf. and | reflexive usage of 3.person possessive | DET (seu, sua, seus, suas) |
superlative |
* internal or redundant secondary tag
(This page was taken from WayBack Machine dump of http://visl.sdu.dk/visl/pt/symbolset-manual.html which is currently out of order.)