LINGUISTICA APPLICATA
A.A. 2016/2017
Fabio Tamburini
fabio.tamburiniunibo.it
LINGUISTICA DEI CORPORA
DATA
|
ARGOMENTO
|
MATERIALI
|
28/9
(Z34) |
Introduzione
alla Linguistica dei Corpora. Legge di Zipf e la dinamica del vocabolario di un testo |
- [McEW] - Capitolo 1 |
29/9
(B) |
Definizione di corpus. |
- [McEW] - Sezioni 2.1 e 3.3 |
30/9
|
Annotazioni. |
-
[CP] - Capitoli 3 e 4 - [LMP] - Capitoli 7 e 8 - Slide utilizzate a lezione (2) - Articolo [Tognini Bonelli, 2000] |
5/10
|
Parametri per la costruzione di un corpus, rappresentatività del campione. | -
Articolo [Atkins, et al. 1992] - [CP] - Capitolo 2, par. 1 - [LMP] Sezione 1.2.1 |
6/10
|
I testi in formato elettronico: codifiche, mark-up e conversione di formati. | -
Slide utilizzate a lezione (3) - [LMP] - Capitolo 2 e 3 (leggere) |
7/10
|
La costruzione
di un corpus: reperimento dei documenti. Metodi di accesso al corpus e text retrieval |
- Slide utilizzate a lezione (4) |
12/10
|
Case study: i corpora
CORIS/CODIS, BoLC e DiaCORIS. |
- Slide utilizzate a lezione (5) - Art. [Rossini Favretti, et al. 2002] - Art. [Tamburini, 2002] - Art. [Onelli, et al. 2006] - Accesso ai corpora |
13/10
|
Web as corpus | -
Slide utilizzate a lezione (6) - Articolo [Baroni, Ueyama, 2006] - [LMP] Sezione 1.4.5 |
14/10
19/10 20/10 26/10 27/10 |
Laboratorio
di Linguistica dei corpora: costruzione e consultazione di un piccolo corpus |
- Laboratorio di corpora I |
28/10
2/11 |
Laboratorio
di Linguistica dei corpora: costruzione e consultazione di un corpus annotato |
- Laboratorio di corpora I |
BIBLIOGRAFIA
[Atkins, et al.
1992]
Atkins, S., Clear, J. and Ostler, N. (1992). "Corpus Design Criteria",
Literary and Linguistic Computing, 7(1).
[Baroni, Ueyama, 2006]
M. Baroni and M. Ueyama. 2006. "Building general- and special-purpose corpora
by Web crawling". In Proc. 13th NIJL International Symposium, Language
Corpora: Their Compilation and Application, Tokyo, 31-40.
[Biber, 1993]
Biber, D. (1993). Representativeness in corpus design.
Journal of Literary and Linguistic Computing, 8(4).
[CP]
Cresti E., Panunzi, A. (2013). Introduzione ai corpora dell'italiano,
Bologna: Il Mulino.
[McEW]
McEnery T. and Wilson A. (1996). Corpus Linguistics.
[LMP]
Lenci A., Montemagni S., Pirrelli V. (2005). Testo e computer. Roma:
Carocci.
[Onelli, et al.
2006]
Onelli C., Proietti
D., Seidenari C., Tamburini F. (2006). "The DiaCORIS project: a diachronic
corpus of written Italian". In Proc. Fifth International Conference
on Language Resources and Evaluation - LREC2006, Genova, Italia.
[Rossini Favretti, et
al. 2002]
Rossini Favretti R., Tamburini F., De Santis C. (2001/2002). "CORIS/CODIS:
A corpus of written Italian based on a defined and a dynamic model". In
A Rainbow of Corpora: Corpus Linguistics and the Languages of the World,
Wilson, A., Rayson, P. and McEnery, T. (eds.), Lincom-Europa, Munich. (2002).
[Tamburini, 2002]
Tamburini F. (2002). "A dynamic model for reference corpora structure definition".
In Proc. Third International Conference on Language Resources and Evaluation
- LREC2002, Las Palmas, Spain.
[Tognini Bonelli, 2000]
Tognini Bonelli, E. (2000). "il corpus in classe: da una nuova concezione
della lingua a una nuova concezione della didattica", in Linguistica
e informatica: multimedialita', corpora e percorsi di apprendimento, Rossini
Favretti R. (a cura di), Bulzoni, Roma, 93-108.