VerbaAlpina – bilancio di un progetto





Keywords: crowdsourcing , umanistica digitale , FAIR principles , FAIR , geolinguistica , VerbaAlpina

Questo contributo è stato scritto da Beatrice Colcuc e Thomas Krefeld in occasione del Workshop Geolingüística digital en el espacio románico europeo organizzato presso la Paris Lodron Universität Salzburg il 18 gennaio 2024.

1. Contributi di VerbaAlpina allo sviluppo della geolinguistica

1.1. Il trasferimento mediale

dai libri....

...ai siti

tre generazioni di atlanti geolinguistici
1a generazione 
monodimensionale
2a generazione
pluridimensionale
  3a generazione
tecnologia web
met. ling. adatta (FAIR)
libri libri e siti   siti 
AIS ADDU    
modelli esemplari
  AsiCa  (link) AsiCa2 (link)
  ASD (link)    
      Metropolitalia
(vgl. Krefeld 2021b)
      VerbaAlpina
(Krefeld/Lücke 2014-)
progetti geolinguistici di Krefeld/Lücke

la 1a e la 2a generazione sono ancora vive:

  • cf. APV/1 per la 1a gen.
  • cf. ALS per la 2a gen.

però: un fiume senza ritorno

lineamenti metodologici della 3a generazione in:

2. Il profilo di VerbaAlpina 

3. Le Alpi

  • perimetro di ricerca: Convenzione delle Alpi
  • forte eterogeneità linguistica
    • tre famiglie linguistiche: romanza, germanica, slava
    • grande diversità dialettale (le varietà del continuum romanzo sono assegnabili a diverse lingue)
  • omogeneità etnografica e topografica (somiglianze geologiche, limitazione a singole forme economiche tradizionali)
  • rete densa di atlanti linguistici e dizionari (in parte georeferenziabili)

4. Obiettivi di VerbaAlpina

  • costruire un'infrastruttura digitale per progetti geolinguistici
  • documentare aree di parole che spesso attraversano i confini di una delle tre famiglie linguistiche (geolinguistica interlinguistica) 

  • identificare le caratteristiche (soprattutto lessicali) comuni al di là dei confini individuali dei dialetti e delle lingue 
  • evidenziare i punti etnolinguistici comuni e divergenti
  • superare la tradizionale limitazione nazionale delle aree dialettali indagate
    → geolinguistica plurilingue 

5. Dati

5.1. Input

  • Atlanti linguistici e dizionari (cartacei e digitali) disponibili per l'arco alpino

  • Piattaforma di crowdsourcing

 

Dati crowdsourcing VA

5.2. Elaborazione

5.2.1. Trascrizione

  • dall'immagine della cartina alla tabella nel database

Finestra descrittiva del dato linguistico in VA

Strumento per la trascrizione dei dati linguistici in VA

5.2.2. Tokenizzazione

  • segmentazione dei dati linguistici trascritti (oppure i dati dal crowd)
  • conversione in IPA 
  • tool
Forma in Beta Code Forma in IPA CONCETTO
una1 mu:g/a1 da1 va/c)/ unɑ myʤɑ dɑ vˡaʨ MANDRIA DI MUCCHE
Tokenizzazione    
una1 unɑ ARTICOLO
mu:g/a1 myʤɑ MANDRIA
da1 PREPOSIZIONE
va/c)/ v ˡaʨ MUCCA

 Esempio di tokenizzazione (in VA).

5.2.3. Tipizzazione

  • raggruppamento di attestazioni linguistiche secondo le caratteristiche linguistiche
  • scopo della tipizzazione: strutturare la varietà delle varianti linguistiche in modo gestibile
  • definizione di "tipo morfo-lessicale": classe di espressioni linguistiche / rappresentante di un gruppo di varianti fonetiche
  • raggruppamento delle attestazioni linguistiche che condividono le seguenti proprietà sotto lo stesso tipo morfo-lessicale:
    1. Famiglia linguistica
    2. Categoria grammaticale
    3. Affissazione
    4. Genere
    5. Tipo di base lessicale
Token kˈaːvra kabrˈuŋ kavrˈɛt kawrˈɛt
Famiglia linguistica roa roa roa roa
Categoria grammaticale sub sub sub sub
Affisso - + + +
Genere f m m m
Tipo morfo-lessicale chèvre/capra caprone capretto capretto
Tipo di base lat. capra lat. capra lat. capra lat. capra

 Esempio di tipizzazione (in VA).

  • La forma di un tipo morfo-lessicale è rappresentata dai lemmi dei dizionari di riferimento:
    • Gruppo germanico/slavo: solo una lingua standardizzata (tedesco e sloveno)
    • Gruppo romanzo: tutti i tipi morfo-lessicale sono rappresentati dalle forme standard francesi e italiane, se disponibili (beurre/burro; lait/latte ecc.); altrimenti, si prende solo una delle due forme (italiano O francese), come nel caso di ricotta; se non esiste una variante del tipo in nessuna delle due lingue romanze di riferimento, si usa la voce di un dizionario dialettale (BLad, LSI, GDBIF ecc.);
    • Nel caso non siano disponibili voci adatte nei dizionari di riferimento, VerbaAlpina propone un tipo morfo-lessicale proprio.
  • Tipo di base: la prima forma storicamente attestata di quel tipo (≅ etimo, ma l'etimo si riferisce allo strato linguistico immediatamente precedente)

5.3. Output

5.3.1. Cartina interattiva

I filtri permettono

Visualizzazione semasiologica del tipo morfo-lessicale "gallina" (roa.)

  • ricerche onomasiologiche (partendo dai concetti):

Tipizzazione delle realizzazioni lessicali del concetto ZANGOLA

Tipizzazione delle realizzazioni lessicali del concetto ACQUA POTABILE

    • Quantificazione dei risultati:

Visualizzazione quantitativa onomasiologica del concetto ZANGOLA

5.3.2. Dati complementari

  • dati toponomastici
  • siti archeologici 
  • tombe ecc.

5.3.3. LexiconAlpinum

      • Lista delle attestazioni e dei concetti presenti ed elaborati da VA
      • Commenti etimologici / etnolinguistici come ad esempio (lat. maceria oppure BURRO)
      • Ogni concetto è accompagnato dal suo Q-ID di Wikidata

Sezione Lexicon Alpinum in VA

6. L’eredità di VerbaAlpina

Thomas Krefeld & Stephan Lücke (2023): What will remain of VerbaAlpina?, Version 1 (24.10.2023, 10:05). In: Korpus im Text, Serie A, 111124, url: https://www.kit.gwi.uni-muenchen.de/?p=111124&v=1 , in particolare la tabella https://www.kit.gwi.uni-muenchen.de/?p=111124&v=1#p:12 

L'esperienza di VerbaAlpina
opportunità
(3 componenti)
rischi
(prospettiva di persistenza)
  • precario; dipendente da
    • web browsers (soggetti ad aggiornamenti)
    • servizi web esterni (e.g. stamen)
      ⇒ assistenza continua necessaria
  • stabile (in gran parte); accessibile tramite
  • problematico (in piccola parte): link esterni (esempio burro)

Bibliografia

  • ADDU = Thun, Harald / Elizaincín, Adolfo (2000-): Atlas lingüístico diatópico y diastrático del Uruguay, Kiel, Westensee.
  • AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, vol. 8, Zofingen (Link).
  • ALS = Ruffino, Giovanni (a cura di) (1991-): Atlante linguistico della Sicilia, Palermo, Centro di studi filologici e linguistici siciliani.
  • APV/1 = Favre, Saverio / Raimondi, Gianmario (a cura di) (2020): Atlas des patois valdôtains - Le lait et les activités laitières, vol. 1, Arvier, Le Château.
  • ASD = Krefeld, Thomas / Lücke, Stephan (a cura di) (2010-2013): Audioatlas siebenbürgisch-sächsischer Dialekte, München (Link).
  • AsiCa = Krefeld, Thomas / Lücke, Stephan (2006-2017): Atlante sintattico della Calabria, München, LMU (Link).
  • AsiCa2 = Englmeier, Tobias / Gacia, Veronika / Krefeld, Thomas / Lücke, Stephan (2019): Atlante sintattico della Calabria rielaborato (Asica2), München, LMU (Link).
  • Colcuc/Mutter 2020 = Colcuc, Beatrice / Mutter, Christina (2020): Interopérabilité des données géolinguistiques à l’exemple du projet VerbaAlpina, in: Bien Dire et Bien Aprandre - Revue de Médiévistique, vol. 35, Lille, Centre d`Études Médiévales et Dialectales de Lille, 131-146.
  • Colcuc/Mutter 2021 = Colcuc, Beatrice / Mutter, Christina (2021): Cartography and interoperability of linguistic data: digital geolinguistics illustrated by the project VerbaAlpina, in: Études Digitales: Ordre numérique et désordre digital, vol. 11, 1, Paris, Classiques Garnier, 23-43.
  • Colcuc/Rodella 2022 = Colcuc, Beatrice / Rodella, Anna (2022): Con parole tue: Dai parlanti a VerbaAlpina attraverso il crowdsourcing, in: apropos [Perspektiven auf die Romania] 9, 187–212 (Link).
  • Krefeld 2021a = Krefeld, Thomas (2021): VerbaAlpina erklärt sich selbst (in 10 Sätzen), VerbaAlpina-de 21/2 (Link).
  • Krefeld 2021b = Krefeld, Thomas (2021): Räumlichkeit des SPRECHERS (iv) – Crowdsourcing für die perzeptive Geolinguistik, in: Lehre in den Digital Humanities, München, LMU (Link).
  • Krefeld 2023 = Krefeld, Thomas (2023): ‘Publikation’ geht in Revision, in: Korpus im Text, Serie A, 104645, München, LMU (Link).
  • Krefeld/Lücke 2014- = Krefeld, Thomas / Lücke, Stephan (a cura di) (2014-): VerbaAlpina. Der alpine Kulturraum im Spiegel seiner Mehrsprachigkeit, online, Ultimo accesso 20/01/2019 ore 16:02 (Link).
  • Krefeld/Lücke 2021 = Krefeld, Thomas / Lücke, Stephan (2021): (Unsere) Prinzipien der virtuellen Geolinguistik, VerbaAlpina-de 22/1 (Link).
  • Krefeld/Lücke 2023 = Krefeld, Thomas / Lücke, Stephan (2023): Sketching out a Virtual Framework for Romance Geolinguistics,, in: Weiland / Quijada van den Berghe / Pustka (2023).
  • Metropolitalia = Krefeld, Thomas / Lücke, Stephan / Bry, François (a cura di) (2010-2013): Metropolitalia. Social Language Tagging, München, online, LMU (Link).

Lascia un commento