Claude fa davvero risparmiare l’80% del tempo?

| 02/12/2025
Interfaccia futuristica con grafici digitali e indicatore all’80% su schermo, in un ambiente high-tech con figure umane sfocate sullo sfondo.

Anthropic ha pubblicato la scorsa settimana uno studio che sostiene una tesi notevole: Claude permetterebbe di risparmiare circa l’80% del tempo necessario per completare una serie di compiti lavorativi.

Secondo l’analisi di 100.000 conversazioni reali con il chatbot, attività che richiederebbero mediamente 90 minuti senza assistenza AI si potrebbero completare in circa 18 minuti. Se confermata, questa sarebbe una trasformazione significativa della produttività sul lavoro.

La ricerca arriva in concomitanza con il lancio di Claude Opus 4.5, presentato come il miglior modello al mondo per il coding. La tempistica non è casuale e fa parte di una strategia comunicativa coerente, ma questo non significa automaticamente che i dati siano inaffidabili.

Vale la pena esaminare lo studio con attenzione per capire cosa dice davvero.

La metodologia dello studio

Per ottenere questi risultati, i ricercatori di Anthropic hanno utilizzato Clio, uno strumento di analisi automatizzata che preserva la privacy degli utenti, analizzando circa un milione di conversazioni con Claude. L’approccio prevede che Claude stesso stimi quanto tempo richiederebbe un compito sia con l’assistenza dell’AI che senza. Le conversazioni sono state poi categorizzate secondo la tassonomia O*NET del Dipartimento del Lavoro statunitense, che classifica circa 20.000 compiti lavorativi specifici.

Il punto critico è proprio questo: le stime di tempo sono generate da Claude, non misurate oggettivamente. Anthropic è consapevole di questa limitazione e ha condotto due tipi di validazione. La prima verifica l’auto-coerenza del modello, ossia se Claude produce stime stabili quando gli vengono poste le stesse domande in modi diversi. I risultati mostrano una buona coerenza, con correlazioni tra 0.89 e 0.93.

La seconda validazione è più interessante perché confronta le stime di Claude con dati reali. I ricercatori hanno testato il modello su migliaia di ticket JIRA di progetti open source, dove erano disponibili sia le stime degli sviluppatori umani che i tempi effettivi di completamento. Claude ha ottenuto una correlazione di 0.44 con i tempi reali, contro lo 0.50 degli sviluppatori che avevano pieno accesso al contesto del progetto. È un risultato che suggerisce che le stime di Claude non sono casuali, ma sono anche alquanto meno accurate di quelle umane quando manca il contesto completo.

I risultati dettagliati

Lo studio mostra che l’uso di Claude varia molto a seconda del tipo di occupazione. Il 37% delle query riguarda compiti di programmazione e informatica, seguiti da scrittura e contenuti creativi al 10%. I settori che richiedono lavoro fisico, come agricoltura e trasporti, sono praticamente assenti dal campione.

I risparmi di tempo variano notevolmente. Alcuni compiti mostrano riduzioni del 95%, come la compilazione di informazioni da report, mentre altri hanno risparmi molto modesti, come il controllo di immagini diagnostiche che registra solo il 20% di tempo risparmiato. La media si attesta all’84%, ma la distribuzione è ampia e concentrata nel range 50-95%.

Un’osservazione significativa riguarda la correlazione tra salari e uso dell’AI. Sia le occupazioni a basso reddito che quelle ad altissimo reddito mostrano tassi di adozione molto bassi. L’uso di Claude è concentrato in professioni con salari medio-alti, come programmatori e copywriter, probabilmente perché queste combinano la necessità di elaborare informazioni testuali con una certa complessità che giustifica l’uso dello strumento.

Le limitazioni ammesse da Anthropic

È importante notare che Anthropic dedica una sezione sostanziale del paper alle limitazioni metodologiche. La principale riguarda il fatto che le stime non tengono conto del tempo necessario per validare, correggere e rifinire ciò che l’AI produce. Se Claude genera un documento in cinque minuti ma poi serve mezz’ora per verificarlo e correggerlo, il risparmio effettivo è molto diverso dall’80% dichiarato.

Lo studio stesso cita ricerche randomizzate controllate che hanno indicato risparmi di tempo molto più contenuti: 56% per alcuni compiti di programmazione, 40% per scrittura, 26% per altre applicazioni di coding, 14% per il servizio clienti, e addirittura risparmi negativi in uno studio su sviluppatori esperti. Questi numeri più bassi probabilmente riflettono meglio la realtà end-to-end che include revisione e integrazione del lavoro dell’AI.

Un’altra limitazione significativa è che il campione proviene solo da utenti di Claude.ai con piani Free, Pro e Max, escludendo API ed Enterprise. Questo crea probabilmente un bias di selezione: le persone usano Claude per i compiti dove pensano che sarà più utile. Inoltre, non è sempre chiaro se una conversazione riguardi lavoro vero o attività personali, sebbene i ricercatori abbiano cercato di filtrare i dati non rilevanti.

L’estrapolazione macroeconomica

Partendo dalle stime task-level, Anthropic calcola che l’adozione universale di Claude nell’economia statunitense nei prossimi dieci anni potrebbe aumentare la produttività del lavoro dell’1.8% annuo. Questo raddoppierebbe il tasso di crescita recente e riporterebbe l’economia americana ai livelli degli anni ’60 e ’90. È una cifra che si colloca nella parte alta delle stime recenti sull’impatto economico dell’AI.

Però questa estrapolazione richiede assunzioni molto forti. Presuppone che i risparmi di tempo osservati nelle conversazioni rappresentino accuratamente la media di tutti i casi d’uso, che l’AI venga adottata universalmente, e soprattutto che le capacità dei modelli rimangano costanti per un decennio, cosa che lo stesso Anthropic considera improbabile. Il calcolo non tiene nemmeno conto di come le aziende potrebbero riorganizzarsi attorno alla nuova tecnologia, che storicamente è stato il fattore principale dei guadagni di produttività.

Un aspetto che merita riconoscimento è che Anthropic ha reso pubblici i dataset completi dello studio su Hugging Face, permettendo a ricercatori indipendenti di verificare e estendere l’analisi. Hanno anche pubblicato il paper completo su arXiv con metodologia dettagliata e invitato economisti ed esperti di policy a fornire feedback. Questa apertura è significativamente diversa dall’approccio di un’azienda che cerca semplicemente di gonfiare i numeri del proprio marketing.

Cosa ci dice davvero questo studio

La cifra dell’80% va contestualizzata correttamente. Non rappresenta il risparmio di tempo reale end-to-end per chi usa Claude nel proprio lavoro quotidiano. Rappresenta invece il tempo che si può risparmiare utilizzando l’AI per quello che sa fare bene, senza considerare tutto ciò che viene prima e dopo: formulare prompt efficaci, rivedere gli output, correggere i testi, integrare il risultato in un workflow che può essere molto più ampio.

Il numero realistico per il guadagno di produttività complessivo è probabilmente più vicino al range 15-50% documentato negli studi controllati, con grande variabilità a seconda del tipo di compito e dell’esperienza dell’utente. Per certi compiti specifici come generare bozze iniziali, riassumere documenti o scrivere codice, l’AI dimostra chiaramente un valore significativo. Per altri compiti che richiedono giudizio complesso, conoscenza tacita o coordinamento con altre persone, i benefici sono più limitati.

Lo studio di Anthropic fornisce comunque informazioni utili su come l’AI viene effettivamente utilizzata nel mondo reale, quali occupazioni la stanno adottando più rapidamente, e quali tipi di compiti vedono i maggiori benefici. La metodologia di analisi delle conversazioni a scala è innovativa e potrebbe migliorare significativamente man mano che i modelli diventano più capaci di stimare accuratamente i tempi.

L’aspetto più interessante forse è l’osservazione che alcuni compiti vedono accelerazioni enormi mentre altri rimangono relativamente inalterati, anche all’interno della stessa professione. Questo suggerisce che piuttosto che sostituire interi lavori, l’AI sta ridefinendo il mix di attività che compongono ogni ruolo professionale, con alcune componenti che diventano molto più veloci e altre che potrebbero paradossalmente diventare colli di bottiglia più critici.

La verità, come spesso accade, sta probabilmente nel mezzo tra l’ottimismo di Anthropic e lo scetticismo dei critici. L’AI in generale sta producendo guadagni di produttività reali e misurabili, ma questi sono inferiori all’80% dichiarato e variano enormemente a seconda del contesto. Il valore dello studio non sta tanto nella cifra specifica quanto nell’aver creato una metodologia per tracciare questi cambiamenti nel tempo, man mano che la tecnologia e il suo utilizzo evolvono.

Considerazioni personali

Bisogna osservare che il guadagno di tempo dipende molto dallo stile di lavoro di ciascuno di noi. Ad esempio, se si vuole sviluppare del software che funzioni molto rapidamente, il guadagno di tempo è ben sopra il 90% . Però bisogna accettare un codice non ottimizzato in cui in futuro sarà difficile mettere le mani senza il supporto dell’AI: guadagna chi ha interessa alla pronta consegna, guadagna molto meno chi pianifica a lungo termine.

Invece i guadagni sono eccezionali nella scrittura di testi sulla base di indicazioni sintetiche, perché gli errori sono pochissimi: per lo più basta correggere 3-4 parole per pagina per adattare il testo al proprio stile. Ovviamente guadagna molto chi legge in fretta e sa correggere un testo a prima vista senza inutili riletture.

Barberio & Partners s.r.l.

Via Donatello 67/D - 00196 Roma
P.IVA 16376771008

Policy
Privacy Policy
Cookie Policy
Termini e Condizioni
iscriviti alla nostra newsletter
Questo sito è protetto da reCAPTCHA e la Informativa sulla Privacy di Google, nonché i Termini di Servizio sono applicabili.