Digital Humanities ed LDH: di cosa ci occupiamo
Partiamo dalla nascita della disciplina, la quale, affermatasi in maniera crescente nel Nuovo Millennio, ha origine nella Linguistica computazionale inventata da Padre Roberto Busa: nel 1949, il gesuita instaurò una cooperazione con IBM per la realizzazione del Lexicon Electronicum Latinum, dizionario informatico utile alla compilazione dell’Index Thomisticus, testo tramite il quale si proponeva di fornire al mondo accademico un elenco delle concordanze lessicali dei testi di San Tommaso d’Aquino. Data l’enorme mole di dati, Padre Busa si rese conto di necessitare di una macchina da addestrare affinché processasse i testi per lui assegnando automaticamente ai lemmi le etichette categoriali di pertinenza.
È facile riconoscere in queste poche righe i concetti fondanti dell’odierna scienza dei dati: “big data”, “AI”, “machine learning”, “emergent technologies”, “NLP”. La tecnologia, definita dal gesuita “nipote di Dio”, in quanto “figlia dell’essere umano”, è d’ausilio allo scienziato dei dati nel ricercare schemi ricorrenti ed analizzare concetti, idee, financo sentimenti soggiacenti alla produzione linguistica che prende in considerazione per il proprio studio.
Ma, ed è questo il fulcro delle Digital Humanities, il contributo personale dell’indagatore è di gran lunga più importante e significativo di quello offerto dal computer: come sottolineato dallo stesso Busa, ricapitolando il proprio ultra-trentennale lavoro, “il rapporto fra i tempi di lavoro umano” – cioè dell’équipe di ricerca – “e macchinico è stato di 100 a 1. Le ore impiegate dai computer sono state meno di diecimila, quelle spese da noi uomini più di un milione”.
Ciò può apparire sorprendente, ma non bisogna compiere l’errore, più frequente di quanto non si pensi, di confondere l’informatica umanistica con l’ingegneria: la prima, a differenza della seconda, è incentrata sugli aspetti qualitativi della ricerca, perché il suo oggetto d’indagine ultimo è l’uomo, non la macchina. La grande sfida delle Digital Humanities è proprio quella di usare strumenti ingegneristici per studiare il comportamento umano.
L’importanza delle Digital Humanities è oggidì cruciale nella ricerca umanistica, poiché l’espressione umana è crescentemente mediata dalla tecnologia infomatica, che la supporta e la ridefinisce. In anni in cui persino il pontefice “cinguetta” via social (https://twitter.com/Pontifex_it), è ormai inconcepibile un essere umano “disconnesso” che svolga un ruolo sociale di una qualche rilevanza.
Se anche volessimo mettere da parte le dimensioni spirituale, teologica e filosofica distintive dell’animale sociale aristotelico, rimarrebbe quella mediale, rimarrebbero i dati: stringhe di testo irriducibili a sequenze di 0 e 1, immagini irriducibili a mappe di pixels e suoni irriducibili a successioni di samples, a meno di non accettare una perdita dell’informazione più rilevante per gli umanisti: il senso. Ed ecco che ricorriamo allora a quella branca dell’intelligenza artificiale chiamata “sentiment analysis”, cioè il tentativo di insegnare al software che un post esprime porzioni dell’interpretazione del mondo dell’utente-autore.
Uno dei numerosi progetti di LDH (non perdete i prossimi aggiornamenti!) verte infatti sulla Named-Entity Recognition (NER) da incrociare colla sentiment analysis, onde determinare quali contenuti generino determinate reazioni nell'audience. Perché?
Perché se un produttore cinematografico vuole conoscere le probabilità di presa sul pubblico potenziale di una sceneggiatura, necessita di statistiche che lo informino sull’incidenza simbolica dei suoi contenuti sull’audience e ciò presuppone l’analisi dei sentimenti correlati alle varie categorie unitarie (esempio ipotetico: attrice protagonista, regista, genere, durata, colori dominanti, tipo di colonna sonora eccetera) emergenti da immensi dataset.
Se un broadcaster televisivo vuole conoscere le criticità dell’ultima edizione di un suo programma di punta che stia perdendo ascolti, allo stesso modo necessita dei nuovi strumenti messi a punto dagli umanisti informatici allo scòpo d’individuare che porzione dell’utenza Facebook che segue il programma esprima insoddisfazione al riguardo e, soprattutto, perché, cioè quali siano le variabili difettose e quindi necessitanti di correzione: il presentatore? Le sfide cui si sottopongono i concorrenti? Un eccessivo degrado valoriale? L’irrealismo di alcune situazioni? E così via.
Appare dunque evidente l’utilità non solo per i ricercatori, quanto anche per il mercato, della ricerca condotta da LDH e degli strumenti che stiamo perfezionando.
In conclusione di questa succinta introduzione al nostro lavoro, Vi proponiamo quattro testi che riteniamo fondamentali per avvicinarsi al mondo delle Digital Humanities da un punto di vista rigorosamente scientifico e ragionevolmente accessibile al tempo stesso a chi non abbia conoscenze informatiche di livello ingegneristico:
1 - Schreibman, S., Siemens, R., Unsworth, J., A Companion to Digital Humanities, 2004, Blackwell of Oxford (http://www.digitalhumanities.org/companion/)
2 - Gold, M. K., Debates in the Digital Humanities, 2012, University of Minnesota Press
3 – Burdick et al., Digital Humanities, 2012, MIT Press
Buona lettura!
Stefano Giovannini, ricercatore di LDH e dottorando in Studi Umanistici del Dipartimento di Scienze della Comunicazione dell’Università Cattolica del Sacro Cuore di Milano