Parte II - NATURAL LANGUAGE PROCESSING

DATA
ARGOMENTO
MATERIALI
-
SPEECH PROCESSING:
  • Caratteristiche del campione audio - parametri acustici
  • Analisi in frequenza - Spettrogrammi
  • Elaborazione automatica della lingua parlata.
  • Speech recognition con HMM e Deep Neural Networks
  • Spoken Dialogue Systems (ChatBots)
- RJ - Capitolo 2
- Slides (II.1), Link
- Slides (II.2), (II.3), (II.3b)
- [FT] - Capitolo 8
-
Tokenizzazione e Sentence splitting - Slide (II.4),
- [Schmid, 2008]
-
MORFOLOGIA COMPUTAZIONALE:
  • Generazione e analisi morfologica
  • Lemmari tabulari, Two-level morphology
- Slide (II.5)
- Beesley & Karttunen [2000] Tutorial, Cap. 1
- [FT] - Sezione 6.2
-
SINTASSI COMPUTATIONALE:
- [FT] - Sezioni 6.3, 6.4, 7.1
- [SLP3] - Capitoli 8, 17, 18
- Slide (II.5) (II.5b) (II.6)
- Paper [Tamburini, 2016]
-
SEMANTICA COMPUTAZIONALE:
  • Risorse lessicali: WordNet and FrameNet.
  • Word Sense Disambiguation.
  • Modelli lessico-semantici distribuzionali.
  • Word, Sentence e Document embedding.
- [FT] - Capitolo 4, Sezioni 6.6, 6.7
- [SLP3] - Capitolo 23
- Slide (II.7), (II.8) (II.9)
- [Miller et al. 93] (solo primi 2 paper)
- [Miller Fellbaum 2007]
- FrameNet site
Articolo [Lenci, 2008]
Cap. 1-4 PhD Thesis [Sahlgren, 2006]
Articoli [Mikolov et al. 2013; Le, Mikolov 2014]
Cap. 1, 2 e 4 da [Liu, 2020]
-
Large Language Model. - NVIDIA online books

REFERENCES

[FT]
Tamburini, F. (2022). Neural Models for the Automatic Processing of Italian, Bologna: Pàtron.

[SLP3]
D. Jurafsky and J.H. Martin (in press). Speech and Language Processing, Prentice Hall. (3rd edition DRAFT)