LINGUISTICA APPLICATA
(Laurea Triennale - Scuola di Lettere e Beni Culturali)
A.A. 2017/2018

(Corso A.A. 2016/2017)

Fabio Tamburini
fabio.tamburiniunibo.it


Il corso fornirà un'introduzione generale all'analisi Linguistica attraverso la progettazione, la costruzione, l'annotazione e la consultazione di corpora mediante l'utilizzazione di opportuni strumenti informatici. Inoltre si affronteranno temi di didattica delle lingue in ambienti tecnologicamente avanzati e una breve introduzione alle metodologie di analisi computazionale delle lingue storico-naturali.
Il programma descritto viene svolto in 60 ore di lezione - 12 CFU (30 ore per il corso da 6 CFU).
Link alla pagina ufficiale sul sito della Scuola.



PROGRAMMA DEL CORSO

12CFU 6CFU

  • Linguistica dei corpora
    • I corpora
      • Cos'è un corpus, come si usa e che tipo di informazioni si possono ricavare.
      • Parametri per la progettazione di un corpus.
      • Rappresentatività e bilanciamento.
      • Analisi sintagmatica e paradigmatica.
      • Concordanze, collocazioni e misure di associazione lessicale.
      • Annotazioni, tipologie e formati.
    • Testi, corpora e loro rappresentazione digitale.
      • I testi in formato elettronico, codifiche, mark-up e conversione di formati.
      • Modalità di reperimento dei materiali.
      • Metodi di accesso al corpus e text retrieval.
    • Case study: i corpora CORIS/CODIS, BoLC e DiaCORIS.
    • Web as corpus.
    • Consultazione di un corpus annotato in laboratorio.
12CFU  
  • Trattamento automatico delle lingue
    • Metodi statistici per il Trattamento Automatico delle Lingue.
    • Fonetica computazionale
      • Caratteristiche del campione audio - foni e formanti.
      • Analisi in frequenza - Tratti soprasegmentali.
    • Morfologia computazionale
      • Generazione e analisi morfologica - Lemmari..
    • Sintassi computazionale
      • Identificazione delle categorie grammaticali (PoS-tagging)
      • Analisi sintattica della frase - Grammatiche per il linguaggio naturale
    • Semantica computazionale
      • Semantica lessicale: WordNet
    • Case Study: Identificazione Automatica della Prominenza Prosodica.
    • Laboratorio di Linguistica Computazionale
    • Laboratorio di Machine Learning



TESTI E RIFERIMENTI BIBLIOGRAFICI

Capitoli tratti dai seguenti volumi (si vedano i link nelle varie sezioni del corso): Per gli studenti NON frequentanti studiare anche: Si raccomanda agli studenti NON frequentanti di contattare il docente, in orario di ricevimento, prima di iniziare lo studio in modo da ricevere tutte le spiegazioni riguardanti i materiali da studiare per l'esame ed evitare così ogni fraintendimento o problema.

SOFTWARE

Seguendo questo link troverete una raccolta di programmi open-source disponibili in rete.


GLI ESAMI

L'esame consisterà in una prova orale.
E' obbligatorio iscriversi all'esame preventivamente utilizzando la procedura online.

Si veda il link alla pagina ufficiale sul sito della Scuola per un'informazione pił completa sulla prova.