martedì 31 dicembre 2013

Di che cosa hanno parlato i giornali nel 2013? Uno studio sul lessico specifico di Huffington Post, Il Fatto quotidiano e Il Post


Non si tratta di una classifica delle parole più belle o più brutte del 2013, né di un sondaggio per sapere quale abolireste: in questo post presento molto sommariamente uno studio quantitativo sulle parole usate nel 2013 da tre giornali online:  Huffington Post, Il Fatto quotidiano e Il Post; più in particolare, sulle parole che nei tre giornali hanno avuto una frequenza insolitamente alta rispetto alla "media", e che possono dunque essere considerate le parole chiave del 2013.

La metodologia che ho usato è la seguente: per tutto il 2013 ho estratto i testi degli articoli pubblicati dalle 3 testate (fino al 30 novembre sono 43.933); ne ho poi calcolato la lista di frequenza (un elenco di tutte le parole usate negli articoli, associato al numero di volte in cui sono usate), e l'ho confrontata con un'analoga lista di frequenza, ricavata da un corpus di riferimento della lingua italiana (il Perugia Corpus), compilato negli anni immediatamente precedenti il 2013. Per ciascuna parola ho calcolato quanto la differenza di frequenza tra i due insiemi di dati (stampa del 2013 e corpus precedente, che rappresenta la "media") è statisticamente significativa; infine, ho analizzato le 500 parole che nei giornali del 2013 sono usate, rispetto al passato, con la differenza di frequenza più significativa.
E' il cosiddetto indice di keyness, che la linguistica dei corpora usa comunemente per individuare il lessico più specifico di un insieme di testi, quello che lo caratterizza meglio. Ciò che risulta sono dunque le parole più key, più peculiari che i tre giornali hanno usato nel corso del 2013.

Il lessico degli articoli di giornale - se consideriamo la sua keyness -  può essere suddiviso in tre categorie differenti:
  • quello che individua i temi, gli eventi di cui si è parlato di più;
  • quello che indica i nomi propri di persona;
  • alcune parole molto comuni (non specifiche di un dominio, ma molto generali), che tuttavia sono usate di più rispetto alla media (e spesso per questo sono le più interessanti).

A - I temi che hanno caratterizzato la stampa nel 2013 rispetto agli anni precedenti

Escludendo i due avvenimenti più coperti dalla stampa quest'anno (le elezioni politiche e il Conclave dello scorso marzo, entrambi rappresentati da numerose parole chiave), i 10 temi che hanno contraddistinto il 2013 nel racconto che ne ha fatto la stampa sono i seguenti (in ordine decrescente di keyness): IMU, legge/riforma elettorale, Siriadecadenza, ILVA (Taranto), larghe intese,  gay (omosessuali, omofobia), Telecom, MPS (banca), diritti (civili, dei cittadini, dei bambini, degli omosessuali, dei lavoratori, dei popoli, dei più deboli, ecc.).

Proseguendo nei ranghi più bassi dell'indice di keyness, oltre al lessico collegato con le inchieste giudiziarie, la magistratura e i processi (procura, sentenza, inchiesta, condanna, Pm, tribunale, udienza ecc.), troviamo i temi descritti dalle seguenti parole: carceri, legge di stabilità, crisi, NSA (datagate), primarie, Alitalia, riforme, armi (chimiche), femminicidio, IVA, Lampedusa, Porcellum, migranti, tagli, fiscale (carico, condono, cuneo), corruzione, Finmeccanica, Rcs, detenuti, tasse, ineleggibilità,  finanziamento (pubblico) ai partiti, disoccupazione, indulto, falchi/colombe, debito.


B. I personaggi che nella stampa hanno caratterizzato il 2013

I 25 nomi propri più usati nel 2013 rispetto al passato
Il grafico mostra come i personaggi nominati con frequenza più alta rispetto agli anni passati sono tutti politici italiani: Grillo, Berlusconi e Letta; con valori sensibilmente più bassi seguono tutti gli altri. I politici stranieri presenti sono solo Obama e Morsi (e più in basso, non presente nel grafico, Assad). I personaggi legati alla cronaca, oltre a Snowden, si trovano molto più in basso nel rango di keyness e sono solo Pistorius e la Pascale.

C. Le parole comuni che la stampa nel 2013 ha usato più della media

Un gruppo di parole comuni che nel 2013 hanno una frequenza anomala sono legate alla rete e alla tecnologia, che è sempre più presente anche nella stampa generalista: Twitter, Facebook, Google, social network, streaming, sito, tweet, online, smartphone, Instagram.
Un secondo gruppo è particolarmente interessante, perché comprende parole che descrivono un clima generale di protesta, di ribellione nei confronti della situazione attuale, sia essa quella italiana o quella di altri paesi, soprattutto del bacino del Mediterraneo: manifestanti, attivisti, piazza, polizia, manifestazione/i, proteste, scontri, militanti. 
Una parola che è stata usata dalla stampa più della media è donne, prevalentemente per raccontare fatti di cronaca che le coinvolgono; la stampa parla spesso di donne abusate, ammazzate, assassinate, che subiscono violenza, che continuano a morire per mano degli uomini.
Insolitamente frequente è anche rischio, associata con una serie ricorrente di altre parole (bancarotta, chiusura, default, collasso, insolvenza, ma anche contaminazione, contagio, malattie, crollo, attacchi terroristici, sommosse).
Infine, è key nel 2013 una parola che vorremmo sparisse dalla stampa in generale, ma che invece resta  ben radicata nell'uso che ne fanno i giornalisti: polemiche. Le polemiche sono aspre, accese, violente, inevitabili, e si scatenano prevalentemente nel mondo della politica.

Ecco, se volessimo esprimere un auspicio su ciò che ci attendiamo dalla stampa per l'anno che sta per cominciare, direi che potrebbe essere questo: meno ricerca affannosa di polemiche e più ragionamenti su fatti quotidiani e concreti, che interessano davvero le persone.

1 commento:

  1. È triste che Berlusconi e l`imu siano tra le parole più frequenti...nel 2014 speriamo vengano rimpiazzate da ripresa e lavoro, che poi sarebbero i temi che interessano davvero le persone.

    RispondiElimina