LINGUISTICA COMPUTAZIONALE
(Laurea Magistrale)

A.A. 2020/2021

Fabio Tamburini
fabio.tamburiniunibo.it


PARTE II: IL TRATTAMENTO AUTOMATICO DELLE LINGUE

DATA
ARGOMENTO
MATERIALI
29/3Th
30/3TG
16/4TF
Introduzione al Machine Learning e al Deep Learning - Slide utilizzate a lezione [II.1].
- Articolo [Emms, Luz, 2007].
- Estratto Slide [Bargava 2016]
9/4TF Metodologie per la valutazione dei prodotti in Linguistica Computazionale - Slide utilizzate a lezione [II.2]
- [OHCL] Capitolo 22
- EVALITA WebSite
12/4TF
13/4TF
FONETICA COMPUTAZIONALE:
- Caratteristiche del campione audio - parametri acustici
- Analisi in frequenza - Spettrogrammi
- Elaborazione automatica della lingua parlata.

- RJ - Capitolo 2
- Slide utilizzate a lezione [II.3], [II.4]
- Articoli [Warner, 2018; Tamburini, 2005]
19/4a4
MORFOLOGIA COMPUTAZIONALE:
- Generazione e analisi morfologica
- Lemmari, Metodi basati su Automi a Stati Finiti (FSA)

- Slide utilizzate a lezione [II.4bis]
- Tutorial Beesley & Karttunen [2000], Cap. 1
20/4a2
23/4A

SINTASSI COMPUTAZIONALE:
- Part-of-Speech Tagging e Lemmatizzazione
- Analisi sintattica della frase, metodologie e problematiche.
- APPROFONDIMENTO: Grammatiche formali per l'analisi delle lingue storico-naturali

- SLP - Capitolo 5
- SLP - Capitolo 12
-
Slide utilizzate a lezione [II.4bis], [II.5]
- Articoli [Tamburini 2000, Charniak 97]
- Articolo [Bosco, Lombardo, 2004]
26/4D
27/4D
30/4A

SEMANTICA COMPUTAZIONALE:
- Semantica lessicale - WordNet e FrameNet.
- Word Sense Disambiguation.
- Modelli lessico-semantici distribuzionali:
   Word Space Models e Latent semantic analysis
   Analisi semantica basata su grafi. Co-occurrence graph.
- Word embeddings e Paragraph vectors.

Slide utilizzate a lezione [II.6] [II.7] [II.8] [II.9]
- [Miller et al. 93] (solo 1° e 2° paper)
- [Miller Fellbaum 2007]
- Slide Petruk
- FrameNet site
- FSNLP - Capitolo 7
Articoli [Lenci, 2008, Lenci, 2018]
Cap. 1-4 tesi PhD [Sahlgren, 2006]
Articolo [Sahlgren, 2008]
Documentazione Infomap-NLP
Articoli [Mikolov et al. 2013, Le, Mikolov, 2014]


BIBLIOGRAFIA

[RJ]
L. Rabiner and B. Juang (1993). Fundamentals of Speech Recognition, Prentice Hall.

[SLP]
Jurafsky and J.H. Martin (2008). Speech and Language Processing, Prentice Hall. DRAFT

[FSNLP]
C. Manning and H. Schu╝tze (1999). Foundations of Statistical Natural Language Processing, MIT Press.

[OHCL]
Mitkow R. (ed.) (2003). The Oxford Handbook of Computational Linguistics.

[TNLP]
C. Ritchie and C. Mellish (2000). Techniques in Natural Language Processing.

K.R. Beesley, L.Karttunen (2000). Finite-State Morphology: Xerox Tools and Techniques.

C. Bosco, V. Lombardo (2004). Dependency and relational structure in treebank annotation.
In Proceedings of Workshop on Recent Advances in Dependency Grammar at COLING'04, Geneve, Switzerland, 2004

E. Charniak (1997). Statistical techniques for natural language parsing. AI Magazine.

G. A. Miller, R. Beckwith, C. D. Fellbaum, D. Gross, and K. Miller (1993). Five Papers on WordNet. Technical report, Princeton University.

G. A. Miller, C. D. Fellbaum (2007). WordNet then and now, Lang Resources & Evaluation (2007) 41:209-214.

F. Tamburini (2000). Annotazione grammaticale e lemmatizzazione di corpora in italiano,
Linguistica e informatica: multimedialita', corpora e percorsi di apprendimento, Rossini Favretti R. (a cura di), Bulzoni, Roma, 57-73.

F. Tamburini (2005). Elaborazione automatica del linguaggio parlato.
In Rossini Favretti R. (Ed.), E-Learning: comunicazione mediata e presenziale. Bologna: BUP, 39-54.

A. Lenci (2008). Distributional semantics in linguistic and cognitive research. A foreword, Italian Journal of Linguistics, 20, pp. 1-31.

A. M. Sahlgren (2006). The Word-Space Model, PhD Thesis, University of Stockholm.

A. M. Sahlgren (2008). The Distributional Hypothesis. Italian Journal of Linguistics, 20 (1), pp. 33-53.