Il metodo CEDA: unire approccio quantitativo e qualitativo
L’analisi qualitativa e quella quantitativa sono componenti della ricerca distinte e mutuamente esclusive (Sudweeks e Simoff, 1999: 37): la prima è un insieme non strutturato di dati testuali analizzati con un metodo interpretativo ed ermeneutico; mentre la seconda è un insieme di dati numerici analizzati con procedure statistiche.
Molte volte, consapevoli dell’eguale valore di tutte e due le tecniche nel conoscere un determinato fenomeno, si è cercato di combinare i due approcci, in modo che le debolezze di uno venissero colmate con i punti di forza dell’altro: ma questo è un compito arduo, in quanto i risultati ottenuti sono spesso incomparabili poiché appartenenti a due universi diversi.
Nonostante le difficoltà, un tentativo in questo senso è stato fatto da Sudweeks e Simoff (1999) che propongono uno schema di ricerca chiamato CEDA (Complementary Esplorative Data Analysis framework) che, pur non mischiando le tecniche dei due approcci, cosa peraltro impossibile, cerca di usare i risultati di entrambi. “CEDA può essere visto come una struttura dinamica che offre una valida integrazione di entrambi i metodi. CEDA applica i metodi quantitativi per ottenere modelli attendibili, mentre i metodi qualitativi servono a catturare l’essenza del fenomeno” (tradotto dall’originale; Sudweeks e Simoff, 1999: 40,41).
Per la parte quantitativa i due autori propongono un
percorso in tre fasi. La prima consiste in un’analisi del contenuto di
tipo quantitativo del testo online, in modo da individuare le variabili
significative. Ogni messaggio viene descritto in termini di contenuto e
di caratteristiche quali la rilevanza, il tempo, il tono, lo scopo,
etc. Una volta codificato in questo modo, il codice viene trasformato
in forma binaria, così da poter essere trattato con metodi matematici e
strumenti informatici. La fase finale consiste nella vera e propria
analisi dei dati tramite una rete neurale autoassociativa. Tale
strumento è un tipo speciale di rete neurale che viene usata per
simulare ed esplorare processi autoassociativi, come potrebbero appunto
essere lo scambio di messaggi online e le connessioni tra il loro
contenuto.
L’associazione in questo tipo di reti neurali viene ottenuta attraverso l’interazione di un set di elementi detti unità, i quali sono legati tra loro da connessioni con peso differente. Tali connessioni possono essere positive, indicanti il livello di connessione, pari a zero, indicanti cioè la non connessione, o negative, cioè inibitorie della connessione. Il valore di queste connessioni viene “imparato” dalla rete neurale durante il processo di training, nel quale la rete analizza dati di cui si conoscono già le connessioni, imparando a trattare set di dati simili20.
Per la parte qualitativa Sudweeks e Simoff propongono una
metodologia meno dettagliata, anche questa volta in tre fasi. La prima
consiste nella categorizzazione delle dimensioni, cioè
nell’identificazione nel contenuto dei messaggi dei principali temi,
regolarità e dimensioni. I due autori propongono come dimensioni più
significative le cinque seguenti: gli argomenti trattati, la
leadership, il dibattito, cioè l’attività di argomentazione e di
scontro, le relazioni, cioè le espressioni di amicizia ed intimità tra
i partecipanti, l’azione, cioè le attività task-oriented o
goal-directed. Ogni volta che nei messaggi si propone un’espressione di
tali categorie, essa viene catalogata ed etichettata.
Tale processo sembra essere simile, ma anche contrario, al disegno di ricerca della Grounded Theory, il quale prevede la creazione e l’etichettatura delle categorie, ma non a priori dell’analisi, bensì durante. Le categorie, infatti, emergono durante la lettura del testo e le loro sottodimensioni vengono definite man mano, fino a saturarsi21. Solo dopo che tutto il testo è stato analizzato si può conoscere quante e quali categorie sono emerse e quali tra queste sono le più significative, cioè quelle maggiormente connesse tra di loro22.
Il secondo passo dell’analisi qualitativa del disegno CEDA
viene indicato come categorizzazione della comunicazione, e consiste
nella categorizzazione del contenuto dei messaggi in tre tipi di
comunicazione: concettuale, socio-emotiva, relativa all’azione o
task-oriented.
Il terzo e ultimo passo viene chiamato tipologia delle dimensioni e
comunicazione e corrisponde ad una terza lettura del testo. Esso
consiste nel suddividerlo in periodi di tempo, identificati sia dai
punti di svolta nel discorso che dalla frequenza dei tipi di
comunicazione individuati nella seconda fase.
I risultati di tale analisi qualitativa vengono poi confrontati con quelli della parte quantitativa secondo il seguente schema.
Figura 1. Applicazione del Complementary Esplorative Data Analysis framework.
Tratto da Sudweeks, F., Simoff, S. J., 1999, Complementary
Explorative Data Analysis. The reconciliation of Quantitative and
Qualitative Principles, in Jones, S. ( a cura), Doing Internet
Research. Critical Issues and Methods for Examining the Net, Sage,
Thousand Oaks, pag. 45.
Come si può notare dallo schema e dalla rigida suddivisione in fasi sia
dell’analisi quantitativa che qualitativa, il CEDA è una metodologia
che ha comunque come scopo quello di individuare regolarità
nell’interazione e modelli di comunicazione all’interno della comunità
online. Esso sembra pertanto inserirsi maggiormente in una cornice
positivista, almeno per quanto riguardo gli scopi dell’analisi, e usare
l’analisi qualitativa come complemento, i cui risultati vengono poi
declinati secondo una prospettiva tendenzialmente quantitativa.
Anche per questi motivi la cornice CEDA non è stata ritenuta adatta allo studio della cultura e delle pratiche della comunità di Auto-Mutuo Aiuto analizzata in questo lavoro di tesi. Ho invece deciso di utilizzare lo schema generale di ricerca in cui Sudweeks e Simoff inseriscono la cornice CEDA.
Essa è infatti concepita come una delle fasi di uno schema
più generale della ricerca in Internet. Schema che si differenzia
forzatamente dal disegno di ricerca classico, in quanto internet, come
si è visto, è un oggetto di studio particolare e cangiante.
Lo schema proposto da Sudweeks e Simoff è il seguente:
- Domain Identification (Identificazione del dominio): Internet comprende molti possibili domini di ricerca, dal commercio elettronico, al Computer-Supported Cooperative Work (CSCW), alle comunità online, per citarne solo alcuni. E’ importante definire il proprio dominio di ricerca, in quanto esso è influente nel selezionare lo scopo della ricerca e il metodo.
- Scope of the Research (Scopo della Ricerca): Individuare quali sono gli interrogativi di ricerca che ci si vuole porre, specifici per il dominio scelto.
- Data Collection and Selection of the Data Sets (Raccolta dei Dati e Selezione dei Set di Dati): Raccogliere i dati, per esempio tutti i messaggi (posts) di un forum, e ordinarli in set di dati simili per un qualche criterio (es. serie temporale, per argomento, per tipo di destinatario).
- Complementary Esplorative Data Analysis: Sudweeks e Simoff propongono di procedere parallelamente con una ricerca qualitativa e con una ricerca quantitativa. Per una trattazione dettagliata di tale metodo si rimanda al loro testo originale (Sudweeks e Simoff, 1999).
- Linking Qualitative and Quantitative Results: Collegare e confrontare i risultati qualitativi e quantitativi.
- Interpretation and Presentation: Interpretazione e presentazione dei risultati.
E’ interessante notare come la fase di analisi dei dati influenzi la definizione del dominio e dello scopo di ricerca, secondo una delle caratteristiche fondamentali della Grounded Theory.
Come già accennato, lo schema di Sudweeks e Simoff è stato seguito, anche se non in maniera specifica, anche nella presente ricerca, ma, per i motivi che verranno spiegati nella prossima sezione, non è stato applicata la framework CEDA, dato che si è preferito un metodo puramente qualitativo, quasi etnografico.
Figura 2. Internet Research Schema.
Tratto da Sudweeks, F., Simoff, S. J., 1999, Complementary
Explorative Data Analysis. The reconciliation of Quantitative and
Qualitative Principles, in Jones, S. ( a cura), Doing Internet
Research. Critical Issues and Methods for Examining the Net, Sage,
Thousand Oaks, pag. 39.
20 Per una spiegazione più esaustiva di cosa sia una rete neurale si consulti il testo di Meraviglia, 2001.
Per un esempio dettagliato di come essa venga applicata all’analisi dei messaggi di testo si veda l’articolo di Berthold et al. 1997.
21 “Per Grounded Theory si intende la teoria sociologica che nasce dai dati di ricerca empirica. Cioè di una teoria che emerge e viene costruita dallo studioso nel corso dell’indagine sul campo e sulla base di degli elementi emersi durante lo svolgimento dell’analisi” Strati, A., 1997, La Grounded Theory, in Ricolfi, L. (a cura), La ricerca qualitativa, NIS, Roma, pag.125, corsivo non presente nell’originale.
22 Per una trattazione più esaustiva sulla Grounded Theory si veda Glaser 1978, Turner 1981 e Martin e Turner 1986.