LINGUISTICA APPLICATA
(Laurea Triennale - Scuola di Lettere e Beni Culturali)
A.A.
2018/2019
Fabio Tamburini
fabio.tamburiniunibo.it
Il corso
fornirà un'introduzione generale all'analisi Linguistica
attraverso la progettazione, la costruzione, l'annotazione e la consultazione
di corpora mediante l'utilizzazione di opportuni strumenti informatici.
Inoltre si affronteranno temi di didattica delle lingue in
ambienti tecnologicamente avanzati e una breve introduzione alle
metodologie di analisi computazionale delle lingue storico-naturali.
Il programma descritto viene svolto in 60 ore
di lezione - 12 CFU (30 ore per il corso da 6 CFU).
Link
alla pagina ufficiale sul sito della Scuola.
PROGRAMMA DEL
CORSO
12CFU |
6CFU |
- Linguistica dei corpora
-
I corpora
- Cos'è
un corpus, come si usa e che tipo di informazioni si possono ricavare.
- Parametri
per la progettazione di un corpus.
- Rappresentatività
e bilanciamento.
-
Analisi sintagmatica e paradigmatica.
-
Concordanze, collocazioni e misure di associazione lessicale.
- Annotazioni,
tipologie e formati.
- Testi, corpora e loro rappresentazione digitale.
- I
testi in formato elettronico, codifiche, mark-up e
conversione di formati.
- Modalità
di reperimento dei materiali.
- Metodi
di accesso al corpus e text retrieval.
- Case
study: i corpora CORIS/CODIS, BoLC e DiaCORIS.
- Web
as corpus.
- Consultazione di un corpus annotato in laboratorio.
|
12CFU |
|
- Trattamento automatico delle lingue
- Metodi statistici per il
Trattamento Automatico delle Lingue.
- Fonetica
computazionale
- Caratteristiche
del campione audio - foni e formanti.
- Analisi
in frequenza - Tratti soprasegmentali.
- Morfologia
computazionale
- Generazione e analisi morfologica - Lemmari..
- Sintassi
computazionale
- Identificazione delle
categorie grammaticali (PoS-tagging)
- Analisi sintattica della
frase - Grammatiche per il linguaggio naturale
- Semantica
computazionale
- Semantica
lessicale: WordNet
- Case Study: Identificazione
Automatica della Prominenza Prosodica.
- Laboratorio di Linguistica
Computazionale
- Laboratorio di Machine
Learning
|
TESTI E RIFERIMENTI
BIBLIOGRAFICI
Capitoli tratti dai seguenti volumi (si vedano i link nelle varie sezioni del corso):
- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e
computer. Carocci.
- McEnery
T. and Wilson A. (2001). Corpus Linguistics, Edinburgh University Press.
- Dispense
e articoli che verranno forniti durante le lezioni.
Per gli studenti NON frequentanti studiare anche:
- Cresti E., Panunzi, A.
(2013). Introduzione ai corpora dell'italiano, Il Mulino.
Si raccomanda agli studenti NON frequentanti di contattare il docente, in
orario di ricevimento, prima di iniziare lo studio in modo da ricevere tutte le
spiegazioni riguardanti i materiali da studiare per l'esame ed evitare
così ogni fraintendimento o problema.
SOFTWARE
Seguendo
questo link
troverete una raccolta di programmi open-source
disponibili in rete.
GLI
ESAMI
L'esame
consisterà in una prova orale.
E' obbligatorio iscriversi all'esame preventivamente utilizzando la procedura online.
Si veda il
link alla pagina ufficiale sul sito della Scuola
per un'informazione pił completa sulla prova.
(Corso A.A. 2016/2017)