domenica 21 maggio 2023

Il mio pomeriggio di coding con ChatGPT



È stato soprattutto incredibilmente utile: ho imparato tantissimo, e tantissimo continuerò a imparare, perché ripeterò l'esperienza. Ma è stato anche divertente, perché a volte mi sono sorpresa a dirmi "adesso, dopo questa mia domanda idiota, chissà cosa penserà di me".

Il mio pomeriggio con ChatGPT era finalizzato a verificare la possibilità di farmi aiutare a scrivere alcuni semplici script in Python per elaborare dei dati linguistici. Una sorta di scrittura assistita: io non conosco quasi per niente Python, di solito uso R, e quindi ho chiesto aiuto a lei (lui?). Il compito era abbastanza semplice, ma con qualche insidia: a partire da un testo annotato per categoria grammaticale e lemmatizzato, nel tipico formato su tre colonne, lo script doveva estrarre solo la colonna dei lemmi e confrontarla con una lista esterna di lemmi (il Nuovo vocabolario di base di Tullio De Mauro). In seguito a questo confronto, lo script doveva creare due documenti: uno con i lemmi presenti nel Vdb, e uno con quelli assenti, aggiungendo, accanto a ciascun lemma, il numero delle sue occorrenze nel testo. Infine, nel documento che contiene i lemmi presenti nel Vdb, doveva inserire all'inizio la percentuale sui lemmi totali: in pratica la copertura del Vdb di quel testo.

Dal mio pomeriggio di coding assistito ho imparato diverse cose. In primo luogo, che ChatGPT è uno strumento straordinario per insegnare a scrivere codice a chi lo sa fare poco. Una formidabile risorsa didattica, quindi, a disposizione di tutti, che non si stanca di spiegare, rispondendo a domande specifiche, cosa significa quella funzione, come si usa e a che serve. In secondo luogo, mi ha insegnato che produrre codice in questo modo collaborativo, nel mio caso per svolgere compiti di pulizia o di estrazione di informazioni dai dati, funziona, e funziona anche bene: il mio script è nel mio pc, lo uso, mi è molto utile. In terzo luogo, che ChatGPT va interrogata (interrogato?) in modo mirato: all'inizio avevo posto un quesito unico, che includeva tutte le funzioni che mi servivano. Il risultato non è stato brillante. Poi ho capito che dovevo chiedere una cosa alla volta, in modo semplice, aggiungendo il passo successivo solo dopo aver verificato che il precedente funzionava. E così il risultato è migliorato di molto. Sono rimasti dei passaggi che non erano pienamente soddisfacenti, ma a poco a poco li abbiamo migliorati insieme: io chiedendo cose sempre più specifiche, lei (lui?) rispondendo in modo sempre più accurato alle mie richieste.

Più in generale, penso che siamo ancora lontani dal percepire quanto e in che cosa uno strumento come ChatGPT possa aiutarci nello svolgimento di particolari compiti. Per adesso, mi limito a constatare che, invece di pensare di sfruttarlo per scrivere la tesi di laurea o il tema di italiano, possiamo molto utilmente servircene per insegnarci a capire e a produrre codice, linguaggio artificiale per svolgere funzioni utili in diversi campi.


lunedì 18 luglio 2022

Il governo che verrà nelle parole della stampa


Il discorso giornalistico è spesso caratterizzato dalla ripetizione insistita di cliché, stereotipi linguistici che ripropongono continuamente abbinamenti di parole cristallizzati. Così ad esempio la stampa racconta sistematicamente storie di persone ferite a colpi d’arma da fuoco, di ingorghi stradali per il traffico in tilt, e di scioperi come insiemi di lavoratori che decidono di incrociare le braccia.

Ci sono tuttavia dei temi ricorrenti, soprattutto in ambito politico, in cui il discorso giornalistico, accanto a questa tendenza alla convenzionalità espressiva, rivela una vocazione straordinariamente e sottilmente creativa. Uno di questi temi è quello delle crisi di governo, durante le quali la stampa, di fronte a un governo che non c’è più, si sforza di immaginare e di descrivere le caratteristiche del nuovo governo che verrà. Sta succedendo anche in questi giorni, con il tormentone della fiducia/sfiducia al governo Draghi.

Per curiosità, sono andata a cercare nel corpus che raccoglie 16 annate di Repubblica (1985-2000) le sequenze di parole con frequenza > 10 che seguono il lemma governo. In particolare, ho cercato:

  • gli aggettivi (es. governo forte);
  • le sequenze di + nome (es. governo di scopo).

Il corpus è interessante, perché permette da un lato di seguire l’evoluzione delle combinazioni usate dal quotidiano per descrivere i governi nell’arco di un quindicennio, dall’altro di confrontarle con quelle usate oggi (su cui scriverò un post successivo). Ecco quello che ho scoperto.

Le caratteristiche

I governi vengono descritti su Repubblica per mezzo di aggettivi riferiti alle loro caratteristiche politiche e istituzionali. Un governo può quindi essere tecnico, tecnico-politico, o politico; istituzionale, parlamentare, costituzionale, presidenziale, pre-elettorale, elettorale o referendario (attestato nel periodo 1987-92). 

Per quanto riguarda la sua composizione, può essere monocolore (1985-93), tripartito, quadripartito o anche pentapartito (1985-94: una specie di reperto archeologico). 

Per il suo orientamento può essere laico, centrista, moderato, neutrale, popolare, minoritario, alternativo, riformista o riformatore. In modo inquietante, un governo può inoltre essere parallelo, o occulto, come in questo articolo del 1989:

La Dc ha poi dato all' Italia anche un'altra anomalia: quella del potere consociativo. Vale a dire la tendenza a cogestire il potere di governo anche con quelle forze che stanno all'opposizione. Naturalmente le si rimprovera di farlo se la consociazione concede potere di governo occulto ai comunisti. Ma la pratica di stare al governo e di trovare dei consoci tra l'opposizione si è parecchio diffusa.

Più interessanti sotto il profilo della creatività sono gli abbinamenti di governo con sintagmi preposizionali introdotti da di. In questi casi, l’inventiva dei vari giornalisti porta alla creazione e all’uso di una lunga serie di combinazioni, che si riferiscono ad esempio: allo spettro di forze politiche che il nascente governo sarebbe in grado di raccogliere attorno a sé (di larga maggioranza, di larghe intese, di [larga/grande] coalizione, di larga convergenza, di minoranza, ma anche di maggioranza); agli obiettivi specifici che il governo si proporrebbe (di programma, di ricostruzione, o, in perfetto politichese, di convergenza programmatica). Quest’ultima locuzione è stata usata nel 1988 per designare una proposta del Partito Comunista per la formazione di un nuovo governo:

[…] dovrebbe essere responsabilità di tutte le forze democratiche contribuire a un governo in grado di dare risposte a questa crisi. Si tratta di un governo di convergenza programmatica, ma abbiamo detto anche un governo di garanzia istituzionale perché si vada in Parlamento senza schieramenti precostituiti a un confronto per rinnovare ciò che va rinnovato.

Le combinazioni possono anche riferirsi allo specifico contesto politico in cui il nuovo governo andrebbe a operare, e su cui cercherebbe di influire, segnando il passaggio ad una fase politica nuova: si parla allora di governo di svolta, di tregua, di emergenza, di servizio, di transizione, di (fine) legislatura, di alternativa, o, con suggestiva metafora enologica, di decantazione: quest’ultima combinazione è usata per la prima volta in Repubblica dal 1987, e si ripresenta periodicamente nel corso di tutto il quindicennio, fino al 2000.

C’è poi il governo del ribaltone, usato da Repubblica nel 1994, nel 1995 e nel 1998, in alternativa al semplice ribaltone, come in questo esempio del 1994:

La posizione di Fini non cambia: si deve andare a votare con il governo Berlusconi. Qualunque altra soluzione vedrà Alleanza nazionale all' opposizione. E "a prescindere dal modo con cui il governo sarà chiamato - del presidente, di tregua, istituzionale, di decantazione o delle regole - sarà per noi unicamente il governo del ribaltone, magari mascherato”.

Un insieme nutrito di combinazioni fa invece riferimento al ruolo di rafforzamento della coesione del paese che viene attribuito al nascituro governo. Si parla quindi di governo di garanzia, di salute pubblica, di unità/unione nazionale, di solidarietà nazionale, di riconciliazione nazionale o di salvezza nazionale.

La durata

I governi di cui Repubblica ha parlato nei 16 anni considerati sono stati a volte definiti stabili, ma anche provvisori, transitori, di breve periodo, o, con locuzione di rara efficacia sintetica, perché evoca allo stesso tempo la brevità della durata, la stagione estiva in cui vedrebbe la luce, e il suo carattere di ininfluente transitorietà, balneari. Lo si deduce da questo esempio del 1986: 

Scontate le dimissioni di Craxi, si apre ora una crisi che sarà certamente lunga e difficile. Così lunga da consigliare, si diceva ieri sera, un momentaneo governo balneare di minoranza in attesa di vederci più chiaro.


martedì 5 luglio 2022

Il frame giornalistico della vicenda umana

In questi ultimi giorni i quotidiani, non solo italiani, dedicano come è ovvio molto spazio alla tragedia della Marmolada, con il racconto del disastro, dei soccorsi e delle vittime.

Come spesso avviene nei fatti di cronaca di forte impatto e grande visibilità, il frame scelto da molti quotidiani italiani è quello della vicenda umana delle vittime, e quindi dei lati personali ed emotivi della vicenda, più che di quelli aderenti al racconto oggettivo dei fatti. L'evento, più che presentato nella sua oggettività, viene raccontato con la lente su ciò che commuove e fa sensazione.

Ecco quindi che Repubblica il 3 luglio apre in prima pagina con il titolo Inferno di ghiaccio, accompagnato dai titoli di altri articoli riportati nelle pagine seguenti. Alcuni presentano ad esempio fenomeni di personificazione: il pianeta che si vendica della follia umana. In modo simile, Libero, sempre del 3 luglio, titola La montagna che uccide.

La personificazione di un elemento naturale (il pianeta, la montagna) consente di attribuire alla natura comportamenti umani, come quello di vendicarsi della condotta non rispettosa dell’uomo. Questa identificazione conferisce al discorso un alone di sensazionalismo, e dipinge gli eventi come lo scontro epico tra due forze contrapposte: l’uomo, che sbaglia e soccombe, e la natura, che lo punisce. Tutto ciò è chiaramente lontano da un racconto oggettivo e misurato dell’evento in questione.


Repubblica, 3 luglio 2022

Libero, 3 luglio 2022



Accanto a questo, i quotidiani nei titoli ricorrono come di consueto ai virgolettati, per riportare le presunte parole pronunciate da alcune delle persone coinvolte. Così ad esempio La Stampa del 5 luglio: “Così la montagna li ha inghiottiti tutti”. Il presunto discorso diretto ha la funzione di aumentare il coinvolgimento emotivo del lettore, che ha la sensazione di parlare direttamente con i protagonisti. 

L’appello agli aspetti personali ed emotivi dell’evento narrato è il tratto che accomuna i quotidiani italiani, che riportano a piene mani le storie private delle vittime (Quei sogni infranti sul ghiacciaio, La Stampa, 5 luglio; Filippo e quei corpi spezzati in un lampo, Repubblica, 2 luglio). L’uso del nome proprio, in particolare, favorisce l’identificazione emotiva con le vittime e la vicinanza empatica coi loro familiari. 

Un confronto con il Times, sempre del 5 luglio, evidenzia in modo macroscopico la diversità dell’approccio. Il quotidiano inglese si limita a riportare in modo sobrio e oggettivo gli elementi essenziali della notizia: gli scalatori uccisi nelle Alpi italiane da un ghiacciaio franato a causa della temperatura elevata. Un atteggiamento di questo tipo nei titoli dei quotidiani italiani, specie se relativi a eventi di grande visibilità come quello in questione, è quasi sconosciuto.



La Stampa, 5 luglio 2022
The Times, 5 luglio 2022















venerdì 6 dicembre 2019

I corpora linguistici dell'Università per Stranieri di Perugia

Il grafico riassume alcuni dati sulla distribuzione degli utenti dei corpora linguistici offerti dalla piattaforma CQP dell'Università per Stranieri di Perugia, che conta 897 account usati in 38 paesi diversi.


giovedì 16 febbraio 2017

Recensione di Fiumi di parole sul portale Treccani

Il portale Treccani pubblica una recensione di Fiumi di parole. Discorso e grammatica delle conversazioni scritte in Twitter, scritta da Daniela Pietrini.

Questo è il link alla recensione.

mercoledì 1 giugno 2016

Fiumi di parole: un nuovo e-book sulla lingua e il discorso di Twitter


Da ieri (31 maggio) l’ebook a cui ho lavorato negli ultimi mesi, Fiumi di parole. Discorso e grammatica delle conversazioni scritte in Twitter, è disponibile
nelle maggiori librerie online e in tutti i formati più diffusi.
Si tratta, almeno a mia conoscenza, del primo studio sistematico italiano sugli aspetti linguistici e discorsivi delle interazioni in Twitter, basato su un ampio campione di dati reali estratti da Twitter, analizzati anche attraverso metodologie statistico-quantitative.
In questa pagina ci sono i link ai siti delle librerie online in cui è possibile acquistare l'ebook.
Questo è l'indice, e questa è l'introduzione.



venerdì 1 gennaio 2016

Le parole più usate dai giornali nel 2015

Come l'anno scorso, gli ultimi due giorni dell'anno ho guardato alcuni dati estratti da quotidiani italiani pubblicati nel 2015, per ricavare, usando metodologie statistiche (la misura della keyness in particolare), le parole che hanno caratterizzato la stampa del 2015 rispetto a quella dell'anno precedente. Ho utilizzato in particolare 45.000 articoli usciti nel 2015 (oltre 21 milioni di parole) e li ho confrontati con 65.000 usciti nel 2014.
Il risultato sono alcune centinaia di parole specifiche degli articoli di giornale di quest'anno: nel confronto con quelle dell'anno precedente, infatti, risultano usate con frequenza statisticamente anomala. Le possiamo quindi considerare le parole chiave usate dalla stampa nel 2015.

Migranti
Il sostantivo più specifico del 2015 è migranti; in generale, tutta l'area relativa ai flussi migratori è molto più presente nella stampa del 2015 rispetto all'anno precedente (sono usati molto di più ad esempio profughiaccoglienza, immigrati, rifugiati, asilo, barconi, immigrazione, scafisti).

Grecia
Un altro tema che ha molto occupato la stampa di quest'anno rispetto all'anno scorso è quello della Grecia e della sua crisi economica, come dimostra l'elevato valore di keyness di parole come Grecia, Atene, Syriza, greci, creditori, grexit.

Terrorismo
I temi legati al terrorismo sono presenti in modo capillare nelle parole-chiave della stampa del 2015: Charlie Hebdo, Isis, Parigi, attentati, terrorismo, terroristi, strage, Bataclan, vignettejihadisti rientrano fra le 100 parole con valori di keyness più alti.

Guerra e religione
Nonostante corrisponda ad un tema sempre molto presente nella stampa, anche guerra ricorre significativamente di più sui giornali di quest'anno, specialmente quando è associato ad elementi lessicali che riguardano la religione (Islam, islamici, musulmani, religione, jihadista).

Cronaca
Alcuni fatti di cronaca, nazionale ed internazionale, sono rispecchiati nell'uso frequente di specifiche parole: ad esempio Volkswagen, relativo allo scandalo che ha coinvolto la casa automobilistica tedesca, Giubileo, CasamonicaExpoxylella, il batterio che ha colpito gli ulivi del Salento.
Da segnalare che il 2015 è stato anche l'anno della scuola, di cui si è parlato significativamente di più rispetto all'anno precedente, e della questione del gender, che ha fatto molto discutere anche sulla stampa.

Nomi propri
Una classe di parole che riporta sempre valori di keyness molto elevati è quella dei nomi propri di persona, che variano molto nell'uso dei giornali a seconda dei periodi. Il 2014 è stato l'anno di Renzi (il nome di persona più caratterizzante). I 20 nomi propri di persona che hanno più caratterizzato la stampa del 2015 sono invece quelli riportati nella tab. 1.

Tab. 1 - I 20 nomi propri di persona più specifici del 2015 rispetto al 2014

I nomi rispecchiano alcuni fatti di cronaca di cui si è molto parlato lo scorso anno (l'aereo precipitato della Germanwings, pilotato da Lubitz, l'attentato a Charlie Hebdo, messo in atto dai fratelli Kouachi, o la sparatoria al tribunale di Milano, ad opera di Giardiello). La politica estera è rappresentata essenzialmente da politici greci, al centro dell'attenzione della stampa per molti mesi, mentre quella italiana dal presidente Mattarella, eletto quest'anno, e da alcuni politici la cui presenza sui giornali è stata evidentemente molto più marcata rispetto all'anno precedente (Salvini, Marino, De Luca, Paita e Gentiloni).

Aggettivi: poca originalità
Infine, è da rilevare la scarsità di aggettivi presenti tra le 500 parole con misura di keyness più elevata: tra questi, indisponibili (riferito a calciatori che non possono giocare la prossima partita), sedicente (relativo all'ambito terroristico: il sedicente Califfato o Stato islamico), satirico, e poi un paio di neo-formazioni di ambito politico (verdiniani e fittiani). Una categoria a parte è quella individuata dall'aggettivo sostantivato impresentabili, che si riferisce soprattutto ai candidati con problemi in sospeso con la giustizia, ma anche a personaggi (troppo) spesso presenti in programmi televisivi o a manifestazioni pubbliche.
In generale, questa scarsità di aggettivi come parole-chiave in un'annata di articoli di giornale indica che i giornalisti tendono a riutilizzare sempre gli stessi: cambiano gli avvenimenti che vengono descritti, quindi, ma si usano tendenzialmente le stesse parole per farlo. Per il 2016 vogliamo auspicare un piccolo sforzo in più nel senso dell'originalità?