LINGUISTICA APPLICATA
A.A. 2016/2017

Fabio Tamburini
fabio.tamburiniunibo.it


LINGUISTICA DEI CORPORA

DATA
ARGOMENTO
MATERIALI
28/9
(Z34)
Introduzione alla Linguistica dei Corpora.
Legge di Zipf e la dinamica del vocabolario di un testo

- [McEW] - Capitolo 1
- [CP] - Capitolo 1
- [LMP] - Introduzione, Sez. 5.4, 5.5, 5.6
- Slide utilizzate a lezione (1)
- Handout [Scheer, 2012]

29/9
(B)

Definizione di corpus.
Rappresentatività.

- [McEW] - Sezioni 2.1 e 3.3
- [CP] - Capitolo 2, par. 1
- [LMP] - Capitolo 1
- Slide utilizzate a lezione (2)
- Articolo [Biber, 1993]

30/9

Annotazioni.
Concordanze e collocazioni.

- [CP] - Capitoli 3 e 4
- [LMP] - Capitoli 7 e 8
- Slide utilizzate a lezione (2)
- Articolo [Tognini Bonelli, 2000]
5/10
Parametri per la costruzione di un corpus, rappresentatività del campione. - Articolo [Atkins, et al. 1992]
- [CP] - Capitolo 2, par. 1
- [LMP] Sezione 1.2.1
6/10
I testi in formato elettronico: codifiche, mark-up e conversione di formati. - Slide utilizzate a lezione (3)
- [LMP] - Capitolo 2 e 3 (leggere)
7/10
La costruzione di un corpus: reperimento dei documenti.
Metodi di accesso al corpus e text retrieval
- Slide utilizzate a lezione (4)
12/10

Case study: i corpora CORIS/CODIS, BoLC e DiaCORIS.
Modalità di accesso a grandi corpora via Web

- Slide utilizzate a lezione (5)
- Art. [Rossini Favretti, et al. 2002]
-
Art. [Tamburini, 2002]
-
Art. [Onelli, et al. 2006]
- Accesso ai corpora
13/10
Web as corpus - Slide utilizzate a lezione (6)
- Articolo [Baroni, Ueyama, 2006]
- [LMP] Sezione 1.4.5
14/10
19/10
20/10
26/10
27/10
Laboratorio di Linguistica dei corpora:
costruzione e consultazione di un piccolo corpus
- Laboratorio di corpora I
28/10
2/11
Laboratorio di Linguistica dei corpora:
costruzione e consultazione di un corpus annotato
- Laboratorio di corpora I


BIBLIOGRAFIA

[Atkins, et al. 1992]
Atkins, S., Clear, J. and Ostler, N. (1992). "Corpus Design Criteria", Literary and Linguistic Computing, 7(1).

[Baroni, Ueyama, 2006]
M. Baroni and M. Ueyama. 2006. "Building general- and special-purpose corpora by Web crawling". In Proc. 13th NIJL International Symposium, Language Corpora: Their Compilation and Application, Tokyo, 31-40.

[Biber, 1993]
Biber, D. (1993). Representativeness in corpus design. Journal of Literary and Linguistic Computing, 8(4).

[CP]
Cresti E., Panunzi, A. (2013). Introduzione ai corpora dell'italiano, Bologna: Il Mulino.

[McEW]
McEnery T. and Wilson A. (1996). Corpus Linguistics.

[LMP]
Lenci A., Montemagni S., Pirrelli V. (2005). Testo e computer. Roma: Carocci.

[Onelli, et al. 2006]
Onelli C
., Proietti D., Seidenari C., Tamburini F. (2006). "The DiaCORIS project: a diachronic corpus of written Italian". In Proc. Fifth International Conference on Language Resources and Evaluation - LREC2006, Genova, Italia.

[Rossini Favretti, et al. 2002]
Rossini Favretti R., Tamburini F., De Santis C. (2001/2002). "CORIS/CODIS: A corpus of written Italian based on a defined and a dynamic model". In A Rainbow of Corpora: Corpus Linguistics and the Languages of the World, Wilson, A., Rayson, P. and McEnery, T. (eds.), Lincom-Europa, Munich. (2002).

[Tamburini, 2002]
Tamburini F. (2002). "A dynamic model for reference corpora structure definition". In Proc. Third International Conference on Language Resources and Evaluation - LREC2002, Las Palmas, Spain.

[Tognini Bonelli, 2000]
Tognini Bonelli, E. (2000). "il corpus in classe: da una nuova concezione della lingua a una nuova concezione della didattica", in Linguistica e informatica: multimedialita', corpora e percorsi di apprendimento, Rossini Favretti R. (a cura di), Bulzoni, Roma, 93-108.