Desenvolvido na Universidade de Lisboa, Departamento de Informática, pelo NLX-Grupo de Fala e Linguagem Natural.
O LX-Tagger é um etiquetador que atribui uma categoria morfo-sintáctica a cada palavra.
A etiqueta morfo-sintáctica é concatenada com a palavra, com o símbolo /
(barra) a separar:
um exemplo → um/IA exemplo/CN
Cada unidade que forma uma expressão multi-palavra é etiquetada com a categoria dessa expressão precedida de "L" e seguida de um número que representa sua posição na expressão:
de maneira a que → de/LCJ1 maneira/LCJ2 a/LCJ3 que/LCJ4
Para demonstração online da ferramenta clique aqui.
Tag | Categoria | Examplos |
---|---|---|
ADJ | Adjectivo | bom, brilhante, eficaz, … |
ADV | Advérbio | hoje, já, sim, felizmente, … |
CARD | Cardinal | zero, dez, cem, mil, … |
CJ | Conjunção | e, ou, tal como, … |
CL | Cliticos | o, lhe, se, … |
CN | Nome | computador, cidade, ideia, … |
DA | Artigo Definido | o, os, … |
DEM | Demonstrativo | este, esses, aquele, … |
DFR | Fracções | meio, terço, décimo, %, … |
DGTR | Números Romanos | VI, LX, MMIII, MCMXCIX, … |
DGT | Dígitos | 0, 1, 42, 12345, 67890, … |
DM | Marcadores de Discurso | olá, … |
EADR | Endereço Electrónico | http://www.di.fc.ul.pt, … |
EOE | Final de Enumeração | etc |
EXC | Exclamativa | ah, ei, etc. |
GER | Gerúndio | sendo, afirmando, vivendo, … |
GERAUX | Gerúndio "ter"/"haver" em termos compostos | tendo, havendo … |
IA | Artigo Indefinido | uns, umas, … |
IND | Indefinidos | tudo, alguém, ninguém, … |
INF | Infinitivo | ser, afirmar, viver, … |
INFAUX | Infinitivo "ter"/"haver" em termos compostos | ter, haver … |
INT | Interrogativos | quem, como, quando, … |
ITJ | Interjeição | bolas, caramba, … |
LTR | Letras | a, b, c, … |
MGT | Classe de Magnitude | unidade, dezena, dúzia, resma, … |
MTH | Meses | Janeiro, Dezembro, … |
NP | Sintagma Nominal | idem, … |
ORD | Ordinal | primeiro, centésimo, penúltimo, … |
PADR | Parte de Endereço | Rua, av., rot., … |
PNM | Parte de Nome Próprio | Lisboa, António, João, … |
PNT | Pontuação | ., ?, (, … |
POSS | Possessivos | meu, teu, seu, … |
PPA | Particípio Passado que não ocorre em termos compostos | afirmados, vivida, … |
PP | Sintagma Preposicional | algures, … |
PPT | Particípio Passado em termos compostos | sido, afirmado, vivido, … |
PREP | Preposição | de, para, em redor de, … |
PRS | Pronome Pessoal | eu, tu, ele, … |
QNT | Quantificadores | todos, muitos, nenhum, … |
REL | Pronome Relativo | que, cujo, tal que, … |
STT | Títulos Sociais | Presidente, drª., prof., … |
SYB | Símbolos | @, #, &, … |
TERMN | Terminações opcionais | (s), (as), … |
UM | "um" ou "uma" | um, uma |
UNIT | Abreviatura de unidade de medida | kg., km., … |
VAUX | Verbos finitos "ter" ou "haver" em forma verbal composta | temos, haveriam, … |
V | Verbos | falou, falaria, … |
WD | Dias da Semana | segunda, terça-feira, sábado, … |
Expressões Multi-palavra | ||
LADV1…LADVn | Advérbios multi-palavra | de facto, em suma, um pouco, … |
LCJ1…LCJn | Conjunções multi-palavra | assim como, já que, … |
LDEM1…LDEMn | Demonstrativos multi-palavra | o mesmo, … |
LDFR1…LDFRn | Fracções multi-palavra | por cento |
LDM1…LDMn | Marcadores Discursivos multi-palavra | pois não, até logo, … |
LITJ1…LITJn | Interjeições multi-palavra | meu Deus |
LPRS1…LPRSn | Pronomes Pessoais multi-palavra | a gente, si mesmo, V. Exa., … |
LPREP1…LPREPn | Preposições multi-palavra | através de, a partir de, … |
LQD1…LQDn | Quantificadores multi-palavra | uns quantos, … |
LREL1…LRELn | Relativos multi-palavra | tal como, … |
Esta ferramenta foi desenvolvida e é mantida na Universidade de Lisboa pelo NLX-Grupo de Fala e Linguagem Natural do Departamento de Informática.
Esta versão inclui o part-of-speech tagger MXPOST Tagger.
O LX-Tagger foi parcialmente financiado pela FCT-Fundação para a Ciência e a Tecnologia.
Para mencionar o LX-Tagger, usar a seguinte referência:
Para utilizar o LX-Tagger tem que aceitar os termos desta licença.
Pode descarregar o programa aqui.
Pode contactar-nos para o seguinte endereço de correio electrónico: 'nlx' seguido de '@' seguido de 'di.fc.ul.pt'.
LX porque Lx é o diminutivo que os lisboetas gostam de usar para se referir à sua cidade.