Desenvolvido na
Universidade de Lisboa, Departamento de Informática,
pelo
NLX-Grupo de Fala e Linguagem Natural.
características
|
english version
Características
Índice
LX-Conjugador
O LX-Conj (versão beta) é um serviço online gratuito para a conjugação completa de verbos portugueses. Foi desenvolvido e é mantido pelo
NLX-Grupo de Fala e Linguagem Natural da
Universidade de Lisboa,
Departamento de Informática.
Talvez seja também do seu interesse experimentar a
LX-Suite, um serviço online de processamento superficial do português.
Características
O LX-Conj toma o infinitivo de um verbo e gera as formas conjugadas correspondentes.
à data do início de funcionamento (Maio de 2005), é o primeiro serviço online gratuito para a conjugação verbal do português em todos os seus pormenores.
Inclui:
- Conjugação pronominal
O sistema de flexão verbal português apresenta um grande número de formas para cada verbo
(cerca de 70 para a conjugação não pronominal), faz uso de um grande número de regras flexionais produtivas e de formas
irregulares assim como de excepções a essas regras.
Esta complexidade aumenta quando se leva em consideração a chamada conjugação pronominal.
Em português existem clíticos verbais, que de acordo com alguns autores devem ser analisados como integrando
o sistema de flexão:
- a forma dos clíticos depende do Número (Singular vs. Plural),
da Pessoa (Primeira, Segunda, Terceira ou Segunda de cortesia), do Género (Masculino vs. Feminino), da sua função gramatical
(Sujeito, Complemento directo ou Complemento indirecto) e das suas propriedades anafóricas (Pronominal vs.
Reflexo);
- a uma mesma forma verbal, podem estar associados até três clíticos (ex.: deu-se-lho);
- os clíticos podem ocorrer em ênclise, isto é, à direita da forma verbal (ex.: deu-o), ou em mesóclise,
isto é, no meio da forma verbal (ex.: dá-lo-ia).
Quando a forma verbal ocorre em certos contextos sintácticos ou semânticos (ex.: no âmbito da negação),
os clíticos surgem em próclise, ou seja, antes do verbo (ex.: não o deu);
- a concatenação dos clíticos segue regras específicas.
A conjugação pronominal é tratada exaustivamente pelo LX-Conj. Contudo é opcional, pelo que os verbos se podem
conjugar de maneira não pronominal.
Para além disto, o LX-Conj lida exaustivamente com um conjunto de casos que tendem a não ser contemplados
na sua totalidade pelos conjugadores verbais:
- Tempos compostos
- Formas duplas de particípios passados (regular e irregular)
- Formas de particípio passado flexionadas em género e número
(com verbos transitivos e inacusativos)
- Formas negativas do imperativo
- Formas de segunda pessoa de cortesia
O LX-Conj suporta tanto verbos conhecidos como desconhecidos. Assim, conjuga:
- Neologismos (com terminação ortográfica de infinitivo)
Vale também a pena mencionar os seguintes princípios de design, que o LX-Conj adopta para os chamados
verbos defectivos:
- Defectivos
Não foram seguidas algumas assunções infundadas da gramática tradicional segundo as quais muitas formas verbais
não existem ou não devem ser utilizadas porque soam estranhas ou porque o seu uso é semanticamente muito
restrito.
Por esta razão, e para dar um exemplo, são geradas todas as formas dos verbos meteorológicos, uma vez que estes podem
sempre ser usadas pelo menos não literalmente (sendo as formas que não as de terceira pessoa do singular
apresentadas numa fonte distinta para indicar que têm sido comummente consideradas inexistentes).
Para dar outro exemplo, são também completamente conjugados verbos como falir
(mais uma vez com algumas das suas formas apresentadas numa fonte diferente para assinalar que alguns falantes
as podem considerar foneticamente bizarras).
- Casos especiais
O LX-Conj assume no entanto que algumas formas verbais são de facto impossíveis (p. ex., as do Imperativo de verbos como
querer: *quer tu) e que certas combinações com clíticos também o são
(por ex., clíticos de segunda pessoa não de cortesia com formas verbais de segunda pessoa de cortesia, ambas com o mesmo número:
*você ama-te), casos que por isso não são gerados.
Entre os restantes casos especiais, também não gerados, encontram-se o se impessoal e o se passivo, que
não ocorrem com formas verbais de primeira ou segunda pessoa.
O LX-Conj lida com os poucos casos em que pode haver formas diferentes em diferentes variantes da língua portuguesa:
- Diferenças ortográficas e paradigmáticas
Quando a mesma forma tem representações ortográficas diferentes, são apresentadas todas essas representações.
Para dar dois exemplos, são gerados tanto desagua (português europeu) como deságua (português do Brasil), e
tanto argui (português europeu) como argüi (português do Brasil).
- Outros casos
As diferenças em formas irregulares são tratadas do mesmo modo. Um exemplo é o particípio passado de aceitar, sendo
aceite (português europeu) e aceito (português do Brasil) ambos mostrados.
é de notar que em geral o LX-Conj reconhece diferenças em representações da mesma forma verbal quando tais representações
podem ser previstas a partir da forma do infinitivo (dado pelo utilizador). Assim, não são automaticamente geradas pelo
conjugador representações do mesmo verbo que diferem apenas na parte não final do radical. Por exemplo, todas as formas da tabela
de conjugação começarão ou por act- ou por at- consoante o utilizador tenha introduzido actuar (português europeu) ou atuar
(português do Brasil) como infinitivo.
Com o objectivo de optimizar a legibilidade e a quantidade de informação das tabelas de conjugação, o LX-Conj adopta o seguinte
esquema para a apresentação dos clíticos:
- Colocação dos clíticos
As variantes do português podem divergir quanto à ordem relativa entre as formas clíticas e as formas verbais. Em algumas variantes,
por ex. na brasileira, em regra os clíticos ocorrem invariavelmente à esquerda da forma verbal (em próclise), enquanto noutras, por ex. na
europeia, os clíticos podem aparecer à esquerda ou à direita (ênclise) do verbo, ou ainda em posição medial (mesóclise), dependendo do contexto
onde a forma verbal ocorre. Para preservar a usabilidade dos conjugadores verbais e evitar sobrecarregar as tabelas de conjugação com todas
as possibilidades lógicas, é conveniente gerar as formas pronominais de acordo com uma das variantes do português. Dado que a colocação dos clíticos segue
uma regra simples no português do Brasil (próclise), os conjugadores verbais tendem a optimizar a informação fornecida aos
utilizadores mostrando a colocação dos clíticos do português europeu. é também esta a opção seguida pelo LX-Conj.
Em português europeu, a ênclise (e a mesóclise para o Futuro e o Condicional) é o padrão de colocação dos clíticos por omissão. Por seu lado,
a próclise é desencadeada por factores sintácticos e semânticos específicos do contexto onde a forma verbal ocorre.
Assim, nas tabelas de conjugação geradas pelo LX-Conj, os clíticos aparecem em ênclise (ou mesóclise) em todos os tempos excepto
nos que ocorrem precisamente nos contextos em que a próclise é exigida (no modo Conjuntivo: o Pretérito Perfeito, o Futuro Simples e o Futuro
Composto; no modo Imperativo: o Negativo). Para estes últimos casos, os clíticos aparecem em próclise nas tabelas de conjugação.
Autoria
O LX-Conj está a ser desenvolvido por
António Branco and
Francisco Costa, com a ajuda de Filipe Nunes e Tiago Henriques, no
NLX-Grupo de Fala e Linguagem Natural, da
Universidade de Lisboa, Departamento de Informática.
Agradecimentos
O trabalho conducente ao LX-Conj foi apoiada em parte
pela FCT-Fundação para a Cência e Tecnologia através do contrato
POSI/PLP/47058/2002 relativo ao projecto TagShare.
Publicações
Costa, Francisco, 2004, Verbal Conjugation in Portuguese, Internal report, University of Lisbon,
Department of Informatics.
Branco, António and Tiago Henriques, 2003,
"Aspects of Verbal Inflection and Lemmatization: Generalizations and Algorithms".
In Amália Mendes and Tiago Freitas (eds.), Proceedings of XVIII Annual Meeting
of the Portuguese Association of Linguistics, Lisbon, pp.201-210.
Contacto
Para contacto, usar o endereço de e-mail: 'nlxgroup' concatenado com '@'
concatenado com 'di.fc.ul.pt'.
Porquê o LX-Conj?
LX porque Lx é o diminutivo que os lisboetas gostam de usar para se referir à sua cidade.