mercoledì 18 aprile 2012

Anatomia di un hashtag

Come si sviluppa una conversazione in Twitter

Mentre ero alla ricerca di strumenti computazionali per analizzare i miei dati di politici italiani su Twitter, mi sono imbattuta in un post che descrive una serie di procedure per analizzare la nascita e l'evoluzione di un hashtag su Twitter, e il peso che su questa evoluzione hanno i retweet. Le procedure sono basate sul pacchetto di analisi statistica open source R, che sfrutta le API di Twitter per estrarre i tweet che contengono un dato hashtag, e successivamente il proprio (potente) motore interno per rappresentarli in modo grafico.
Per sperimentare questa metodologia di analisi ho scelto un hashtag che era indicato oggi tra i più frequenti tra quelli italiani (#filmmalati); ho fissato a 350 il numero di tweet (contenenti #filmmalati) da estrarre, ottenendo così un segmento di quella conversazione (che può essere ampliato: le API di Twitter consentono di estrarre fino a 1500 tweet). Poi ho creato un primo grafico, quello qui sotto. Come si vede, l'hashtag ha origine da un singolo tweet (quello più in basso a sinistra, poco prima delle 17.30), ma man mano la presenza di retweet (i punti rossi) diventa determinante per la diffusione della conversazione incentrata su quell'hashtag.
350 tweet con hashtag #filmmalati. La colonna a sinistra contiene i nomi degli autori dei tweet. I punti azzurri sono tweet, quelli rossi retweet.

Proseguendo con l'analisi, ho potuto vedere in dettaglio chi sono gli utenti che vengono retwittati, e da chi. Il grafico seguente mostra solo i retweet (tra i 350 tweet estratti);  la colonna a sinistra contiene l'elenco di chi viene retwittato, la riga in basso l'elenco di chi retwitta. Le righe molto piene sono quindi utenti molto retwittati (il sesto utente cominciando dal basso, ad esempio, è uno che ha avuto successo perché è stato retwittato 10 volte; su 350 non è male); le colonne trafficate sono invece gli utenti che retwittano molto.

Grafico dei retweet: nella colonna a sinistra, i nomi di chi è retwittato, nella riga sotto i nomi di chi retwitta.
L'esempio è (per ora) limitato, ma serve a mostrare, anche visivamente, che le conversazioni in Twitter prendono avvio da un singolo tweet, che per qualche motivo è in grado di far scoccare la scintilla dell'adesione di massa e di scatenare l'esplosione di un gran numero di altri tweet, raccolti intorno allo stesso tema (hashtag). In questo effetto valanga, un ruolo importante è svolto dal meccanismo dei retweet, che servono a propagare e ad ampliare le dimensioni di questa valanga.
Infine, l'esempio serve anche a mostrare quanto uno strumento come R sia prezioso (anche per i linguisti e gli studiosi dei media), e quanto la filosofia dell'open-source sia una delle (poche) manifestazioni di intelligenza che ancora riusciamo a produrre.

Fonte:
Tony Hirst, Visualising Activity Around a Twitter Hashtag or Search Term Using R, 6 febbraio 2012.
Il pacchetto di R da installare per interagire con le API di Twitter si chiama twitteR.

2 commenti:

  1. Complimenti per questo articolo. Ma nella pratica come è riuscita a fare la ricerca di un hashtag su R-progect? Ha usato una guida in particolare? Vorrei provare pure io a fare una ricerca del genere.
    Saluti
    Claudia

    RispondiElimina
  2. Ho seguito queste indicazioni:
    http://www.r-bloggers.com/visualising-activity-around-a-twitter-hashtag-or-search-term-using-r/
    Stefania

    RispondiElimina