LINGUISTICA COMPUTAZIONALE
(Laurea Magistrale)

A.A. 2022/2023

Fabio Tamburini
fabio.tamburiniunibo.it


PARTE II: IL TRATTAMENTO AUTOMATICO DELLE LINGUE

DATA
ARGOMENTO
MATERIALI
27/3
28/3
31/3
Introduzione al Machine Learning e al Deep Learning - Slide utilizzate a lezione [II.1], [II.1b]
- [FT] - Sezione 2.3, Cap. 3
- Articolo [Emms, Luz, 2007].
- DNN 3D Viewer
31/3 Metodologie per la valutazione dei prodotti in Linguistica Computazionale - Slide utilizzate a lezione [II.2]
- [FT] - Capitolo 5
- EVALITA WebSite (PoS 2007)
3/4
4/4
FONETICA COMPUTAZIONALE:
- Caratteristiche del campione audio - parametri acustici
- Analisi in frequenza - Spettrogrammi
- Elaborazione automatica della lingua parlata.
- Chatbot e sistemi di dialogo.
- Slide utilizzate a lezione [II.3], [II.4], [II.4a]
- [RJ] - Capitolo 2
- [FT] - Capitolo 8
- Articoli [Warner, 2018; Tamburini, 2005]
14/4
MORFOLOGIA COMPUTAZIONALE:
- Generazione e analisi morfologica
- Lemmari, Metodi basati su Automi a Stati Finiti (FSA)
- Slide utilizzate a lezione [II.4b]
- [FT] - Sezione 6.2
- Tutorial Beesley & Karttunen [2000], Cap. 1
14/4
17/4

SINTASSI COMPUTAZIONALE:
- Part-of-Speech Tagging e Lemmatizzazione
- Analisi sintattica della frase, metodologie e problematiche.
- APPROFONDIMENTO: Grammatiche formali per l'analisi delle lingue storico-naturali

- [FT] - Sezioni 6.3, 6.4, 7.1
- [SLP] - Capitolo 5
- [SLP] - Capitolo 12
-
Slide utilizzate a lezione [II.4b], [II.5]
- Articoli [Tamburini 2000, 2016]
- Articolo [Bosco, Lombardo, 2004]
2/5
5/5
8/5

SEMANTICA COMPUTAZIONALE:
- Semantica lessicale - WordNet e FrameNet.
- Word Sense Disambiguation.
- Modelli lessico-semantici distribuzionali:
   Word Space Models e Latent semantic analysis
   Analisi semantica basata su grafi. Co-occurrence graph.
- Word embeddings e Paragraph vectors.
- Large Language Models.

Slide utilizzate a lezione [II.6] [II.7] [II.8]
- [FT] - Capitolo 4, Sezioni 6.6, 6.7, Parte III
- [SLP] - Capitoli 19 e 20
- [Miller et al. 93] (solo 1° e 2° paper)
- [Miller Fellbaum 2007]
- FrameNet site
Articoli [Lenci, 2008, Lenci, 2018]
Cap. 1-4 tesi PhD [Sahlgren, 2006]
Articolo [Sahlgren, 2008]
Articoli [Mikolov et al. 2013, Le, Mikolov, 2014]


BIBLIOGRAFIA

[FT]
Tamburini, F. (2022). Neural Models for the Automatic Processing of Italian, Bologna: Pātron.

[RJ]
L. Rabiner and B. Juang (1993). Fundamentals of Speech Recognition, Prentice Hall.

[SLP]
Jurafsky and J.H. Martin (2008). Speech and Language Processing, Prentice Hall. DRAFT

K.R. Beesley, L.Karttunen (2000). Finite-State Morphology: Xerox Tools and Techniques.

C. Bosco, V. Lombardo (2004). Dependency and relational structure in treebank annotation.
In Proceedings of Workshop on Recent Advances in Dependency Grammar at COLING'04, Geneve, Switzerland, 2004

E. Charniak (1997). Statistical techniques for natural language parsing. AI Magazine.

G. A. Miller, R. Beckwith, C. D. Fellbaum, D. Gross, and K. Miller (1993). Five Papers on WordNet. Technical report, Princeton University.

G. A. Miller, C. D. Fellbaum (2007). WordNet then and now, Lang Resources & Evaluation (2007) 41:209-214.

F. Tamburini (2005). Elaborazione automatica del linguaggio parlato.
In Rossini Favretti R. (Ed.), E-Learning: comunicazione mediata e presenziale. Bologna: BUP, 39-54.

A. Lenci (2008). Distributional semantics in linguistic and cognitive research. A foreword, Italian Journal of Linguistics, 20, pp. 1-31.

A. M. Sahlgren (2006). The Word-Space Model, PhD Thesis, University of Stockholm.

A. M. Sahlgren (2008). The Distributional Hypothesis. Italian Journal of Linguistics, 20 (1), pp. 33-53.