18 ottobre 2013

Pazienti 2.0. Temi e relazioni di una community di pazienti diabetici

Vai a English version

Quello che segue è un esempio di un approccio che tenta di combinare l'analisi strutturale di una rete sociale (un forum di discussione on-line) e l'analisi del contenuto dei messaggi scambiati, allo scopo di rappresentare le relazioni tra gli utenti anche in considerazione dei contenuti scambiati (e vice versa). In questo caso, si tratta di un forum dedicato ai pazienti diabetici.

Un altro esempio della procedura di analisi qui adottata è illustrato nel post Autonomie a rischio: attori e temi del dibattito sul destino della Provincia di Teramo.

Questo lavoro è stato presentato al Workshop “Nuove tecnologie, mutamento sociale e costruzione del Sé“, nell’ambito del Convegno “La qualità del sapere sociologico“, AIS-Associazione Italiana di Sociologia, (Firenze 10-12 ottobre 2013).




Il forum analizzato è "Diabete e Patologie Correlate", all’interno della piattaforma ForumSalute.it, individuato attraverso una ricerca su Google, in base a criteri di visibilità, struttura e livelli di attività.

La rilevazione ha riguardato i messaggi pubblicati fra il 15 aprile 2012 e il 15 aprile 2013, data alla quale sono state anche raccolte le statistiche del forum e quelle relative agli utenti.

Come si può vedere nella Slide 4, gli utenti sono in gran parte donne e residenti del centro-nord.

Le informazioni relative all’età degli utenti sono molto spesso mancanti (in 60 su 76 casi). L’età degli utenti per i quali l’informazione è disponibile è comunque bassa, con una media è pari a 23 anni, e il 75% dei casi che sta fra i 19 e 39 anni.

La giovane età degli utenti è un aspetto confermato anche dal diabetologo nel corso dell’intervista telefonica condotta durante la rilevazione, e dal fatto che le discussioni più seguite sono quelle relative al diabete gestazionale e quello di tipo 1 trovino più spazio del diabete di tipo 2, molto più diffuso in termini assoluti, ma principalmente nella popolazione adulta e soprattutto anziana.

Il grafo della Slide 5 rappresenta le dinamiche del forum. Si tratta di un grafo bipartito, composto cioè da due tipi di nodi: le discussioni e gli utenti. Gli utenti in effetti entrano in relazione fra di loro nel momento in cui partecipano ad una stessa discussione.

Il network è fortemente centralizzato intorno al nodo del moderatore e nello stesso tempo molto disperso. Ciò dipende dalla caratteristica dinamica a “domanda—risposta”: gli utenti intervengono per porre una domanda e il diabetologo risponde. Di conseguenza la metà dei threads iniziati ha avuto al massimo due risposte (di cui una è quasi sempre quella dell’esperto), e il 75% meno di quattro risposte. In conclusione, possiamo dire che, all’interno di questo forum, gli utenti interagiscono principalmente con lo specialista e poco fra di loro.

Nondimeno, il grafico nella Slide 6 mette in evidenza il fatto che un limitato numero di utenti ― tutte donne ― ha fatto una certa “carriera” all’interno della piattaforma, arrivando ad occupare lo status di Esporto o Fan (lo status dipende dal numero di messaggi postati sul forum). Nello stesso tempo, abbiamo rilevato che le utenti più attive frequentano un elevato numero di forum, dove le interazioni fra utenti sono più frequenti. Se quindi da una parte abbiamo visitatori e utenti interessati solo ad avere informazioni specifiche, dall'altra ci sono utenti per i quali la spinta alla socialità è altrettanto forte ― se non di più ― della semplice ricerca di informazioni.

Per analizzare i temi discussi si è proceduto ad una analisi tematica dei contenuti dei messaggi.

La wordcloud della Slide 7 rappresenta i lemmi selezionati come parole chiave dei messaggi, con una soglia minima pari a 10 occorrenze.

I temi sono stati individuati attraverso una procedura automatica, detta “modellizzazione dei temi emergenti”, disponibile nel software TLab. La procedura identifica i temi a partire dalle relazioni fra i lemmi presenti nei singoli messaggi.

Nella Slide 9 i 25 temi individuati sono essere rappresentati in maniera sintetica mediante una mappa MDS (multidimensional scaling). Tenendo conto della distanza/vicinanza dei punti (le cui dimensioni sono proporzionali alla rilevanza dei temi in termini di occorrenze), possiamo osservare che:
  • l’asse delle X (destra / sinistra) distingue la ricerca di informazioni dall'espressione di dubbi e ansie
  • l’asse delle Y (alto / basso) distingue invece fra temi più o meno strettamente legati al diabete
Gli interessi degli utenti spaziano dalla ricerca di informazioni legate strettamente al diabete, all'espressione di ansie solo debolmente collegate ad esso.

Al termine dell’analisi tematica, sono stati associati gli utenti ai temi, per il tramite dei messaggi, costruendo quello che è stato chiamato un content based social network (Velardi et al. 2008; Bohn et al. 2011).

In questo grafo le connessioni utente-tema rappresentano le occorrenze dei temi nei messaggi degli utenti (e non i messaggi, in quanto si possono avere più temi per ciascun messaggio). Rispetto al grafo della Slide 5, questo è meno disperso, e mostra un elevato numero di connessioni fra i nodi.

Nello stesso tempo però, esso non descrive le relazioni fra gli utenti così come si sono effettivamente realizzate: il legame fra due nodi-utente e un nodo-tema va concepita come comune riferimento a ― e dunque interesse nei confronti di — un tema.
Infine, sono stati classificati gli utenti gli utenti in base ai temi che condividono, e dunque in base ad una prossimità che si potrebbe definire, piuttosto che semantica, pragmatica, legata cioè al senso che essi attribuiscono alla loro partecipazione al forum (piuttosto che ai temi in quanto tali):
  • Un nucleo centrale e caratterizzante il forum, definito dalle interazioni degli utenti con lo specialista, sui temi più diversi (“Diabetologo”);

  • Un secondo gruppo (“Informazioni”) di utenti che hanno, o pensano di avere, il diabete e sono in cerca di informazioni su specifici sintomi o risultati di esami;

  • Terzo per numerosità il cluster “Terapia”, formato da utenti che chiedono informazioni sulla Metformina e la terapia;

  • Il cluster “Dubbi” accorpa gli utenti che tendono ad esprimere dubbi di varia natura e a cercare informazioni sul diabete qui e là, forse anche nel tentativo di gestire in autonomia questo aspetto della loro vita;

  • Ruota infine attorno ad un utente particolarmente ansioso l’ultimo cluster, dove i dubbi e le ansie espresse sono i più disparati. Il cluster è stato per questo definito “Ipocondria”.

Riferimenti bibliografici

  1. Bohn, A., Feinerer, I., Hornik, K., & Mair, P. (2009). An Approach to Incorporate Texts into a Social Network Analysis of Communication Graphs (No. 96). Department of Statistics and Mathematics, WU Vienna University of Economics and Business, Vienna. Retrieved from http://epub.wu.ac.at/1654/

  2. Velardi, P., Navigli, R., Cucchiarelli, A., & D’Antonio, F. (2008). A New Content-Based Model for Social Network Analysis. In 2008 IEEE International Conference on Semantic Computing (pp. 18 – 25).  doi:10.1109/ICSC.2008.30

English version

The following post is an example of an approach that combines the structural analysis of a social network (an online discussion board) and the content analysis of the messages exchanged, aimed at representing the relationships between the users also in consideration of the content exchanged (and vice versa ).

Another example of this approach is published here in  Autonomie a rischio: attori e temi del dibattito sul destino della Provincia di Teramo.

This study was presented at the Workshop “Nuove tecnologie, mutamento sociale e costruzione del Sé", within the Conference “La qualità del sapere sociologico“, AIS-Associazione Italiana di Sociologia, (Florence 10-12 ottobre 2013).

https://www.slideshare.net/agnesevardanega/pazienti-20

The forum analysed is “Diabetes and Related Diseases” (“Diabete e Patologie Correlate”), within the platform ForumSalute.it, retrieved on Google, and chosen according to criteria of visibility, structure and levels of activity. The analysis has covered all the posts published between April 15, 2012 and April 15, 2013, date on which we have collected the statistical data related to the Forum and its users.

As we can see in Slide 4, participants (users) are mostly women and residents of the center-north of Italy.

Data related to the age are mostly missing (in 60 of 76 cases). However, it is possible to hypothesize that it is low, since: a) the average age of the users for whom the information is available is low (23 years); b) it has been confirmed by the diabetologist / moderator of the discussion board (in a telephone interview); c) discussions are most often related to gestational and type 1 diabetes (rather than type 2, prevalent in absolute terms, and mainly in the adult and elder population).

The graph in Slide 5 represents the dynamics of the forum. It is a bipartite graph, with two types of nodes: threads and users. Users are connected in a relationship, as they participate to the same discussion.

The network is highly centralized around the node of the moderator, and, at the same time, it is very dispersed. This depends on the typical dynamic "question-answer": a user ask a question and the diabetologist answers. Accordingly, half of the threads have a maximum of two replies and 75% less than four replies. In conclusion, the graph shows that users interact mainly with the specialist and little between them.

However, as shown by the chart in Slide 6, a limited number of users - all women - have done some "career" within the platform, occupying the status of Expert or Fan (statuses depend on the number of posts published). At the same time, we have found that the more active users participate to several forums, where direct interactions are more frequent. If most visitors and users are exclusively interested in retrieving specific information about diabetes, for other users sociability is equally strong - if not stronger - than the simple search for information.

To analyse the discussions, it has been carried out a thematic analysis of the messages.

The wordcloud in Slide 7 represents the keywords of the messages, with a minimum threshold of 10 occurrences.

Themes in Slide 8 have been identified through an automated process, called "modeling of emerging themes", available in the software Tlab.The procedure identifies themes from the relations between lemmas (headwords) in each message.

In Slide 9, the 25 themes are represented in an MDS map (multidimensional scaling). Considering the distance / proximity of the points (whose dimensions are proportional to the relevance of the themes in terms of occurrence), it is possible to observe that:

  • the X-axis (from left to right) distinguishes the search for information and the expression of doubts and anxieties

  • the Y axis (from up to down) distinguishes issues more or less closely related to diabetes

The interests of users range from the search for information strictly related to diabetes, to the expression of anxiety only weakly connected to it.

At the end of thematic analysis, themes have been linked to the users through the messages, and a content-based social networks (Velardi et al. 2008; Bohn et al. 2011) - have been built.

In the graph shown in Slide 10, the links between users and themes does not represent the messages, but the occurrences of themes in the messages (it is possible to have multiple themes for each message). Compared to the graph in Slide 5, this one is less dispersed, and shows a higher number of connections between the nodes.

At the same time, however, it does not represent the relationships between users as they actually occur in the network: links should be conceived as a common reference to - and thus interest in - a topic.

Finally, users have been classified on the basis of the topics, and, in this sense, their proximity could be defined ‘pragmatic’, being related to the meaning users give to their participation in the forum (and not to the topics as such):

  • A core group, characterizing the forum, is defined by the interactions with the specialist, and related to several themes (“Diabetologo” - “Diabetologist”);

  • A second group (“Informazioni sul diabete” - “Information on diabetes”) is constituted by users who have (or suspect they have) diabetes and are looking for information on specific symptoms or results of medical analyses;

  • A third cluster (“Terapia” - “Therapy”), is formed by the users who ask for information about Metformin and therapy;

  • The cluster “Dubbi” (“Doubts”) gathers users who tend to express doubts and thus to seek information here and there, perhaps in an attempt to self-manage this aspect of their lives;

  • The last cluster is focused on a particularly anxious user, involving diverse doubts and anxieties, and more than a moderator. For this reason, the cluster has been defined “Ipocondria” (“Hypochondria”).

References

  1. Bohn, A., Feinerer, I., Hornik, K., & Mair, P. (2009). An Approach to Incorporate Texts into a Social Network Analysis of Communication Graphs (No. 96). Department of Statistics and Mathematics, WU Vienna University of Economics and Business, Vienna. Retrieved from http://epub.wu.ac.at/1654/

  2. Velardi, P., Navigli, R., Cucchiarelli, A., & D’Antonio, F. (2008). A New Content-Based Model for Social Network Analysis. In 2008 IEEE International Conference on Semantic Computing (pp. 18 – 25).  doi:10.1109/ICSC.2008.30

Nessun commento:

Posta un commento