Faculdade de Ciências Sociais e Humanas

Introdução à Linguística Informática

Código

711131047

Unidade Orgânica

Faculdade de Ciências Sociais e Humanas

Departamento

Linguística

Créditos

6

Horas semanais

4

Língua de ensino

Português

Objectivos

a) Reflectir sobre o funcionamento da língua tendo em vista a computação;
b) Compreender o funcionamento das ferramentas informáticas para o tratamento natural da língua;
c) Adquirir metodologias para a organização de dados textuais para o tratamento automático;
d) Saber anotar e etiquetar os dados textuais;
e) Adquirir metodologias para a extracção semi-automática e automática da informação;
f) Aplicar os conhecimentos adquiridos

Pré-requisitos

Não tem

Conteúdo

1. Linguística e computação; 2. Trabalho terminográfico e lexicográfico; 3. Linguística de corpora; 3.1. Definição de corpus; 3.2. Constituição de corpus; 4. Extracção semi-automática de dados; 4.1. Concordâncias; 4.2. Contextos automáticos; 5. Constituição de base de dados; 5.1. Bases de dados relacionais; 5.2.Bases de Dados textuais; 6. Dicionários electrónicos; 7. Tratamento automático da língua; 7.1. Sistemas de anotação e de etiquetagem.

Bibliografia

GASIDE, Roger, Geoffrey LEECH, Anthony McENERY, Corpus Annotation. Linguistic Information from Computer Text Corpora, London & New York, Longam, 1997
HABERT, Benoît, Adeline NAZARENKO, André SALEM, Les linguistiques de corpus, Paris, Armand Colin, 1997
KENNEDY, Graeme, An Introduction to Corpus Linguistic, London & New York, Longman, 1998
PRUVOST, Jean, Dictionnaires et nouvelles technologies, Paris, PUF, 2000

Método de ensino

Exposição teórica; Apresentação e discussão de trabalhos individuais; Apresentação e discussão de trabalhos de grupo.

Método de avaliação

Exercícios de aplicação da matéria dada; apresentação oral individual de um artigo científico; um teste escrito sobre a globalidade da matéria.

Cursos