Blast - Quotidiano di diritto economia fisco e tecnologia

Blast - Quotidiano di diritto economia fisco e tecnologia

Tecnologia

L'illusione dell'IA che lavora al posto nostro (e il problema giuridico che molti nascondono)

di Claudio Garau

Avatar di Blast
Blast
feb 06, 2026
∙ A pagamento

Negli ultimi anni il dibattito sull’intelligenza artificiale nel mondo del lavoro si è nutrito di una promessa ricorrente. Anzi quasi una minaccia: l’automazione delle attività intellettuali. Avvocati, consulenti del lavoro, commercialisti, analisti, funzionari amministrativi e knowledge worker in generale: tutti potenzialmente sostituibili da agenti AI capaci di “ragionare”, consultare documenti e prendere decisioni operative. Modelli capaci di ragionare meglio, più velocemente e a costi infinitamente inferiori.

Ma la distanza tra narrazione e realtà è oggi più evidente che mai. Anzi, la realtà sta emergendo in modo molto meno spettacolare. E molto più istruttivo. Da un lato, abbiamo i dati empirici. Dall’altro, il diritto, le leggi. E nel mezzo, una questione che resta “colpevolmente” sottovalutata, ossia la responsabilità dell’individuo (e non certo della macchina).

Nuovi dati diffusi da un’azienda leader nel settore dell’IA e dell’addestramento dati, come Mercor, ci offrono un vero e proprio “bagno di realtà”, grazie a nuovi benchmark denominati Apex-Agents. Rappresentano uno spartiacque concettuale, ma non perché rivelino che l’IA sbaglia - è cosa nota, in fondo - ma perché mostrano dove e perché fallisce.

Quando gli agenti IA vengono messi di fronte a compiti professionali realistici, comprendenti documenti distribuiti, strumenti aziendali diversi, memoria di medio periodo e vincoli di contesto che si evolvono nel tempo, falliscono circa nel 75 per cento dei casi. Anche i modelli più performanti, come Gemini 3 Flash, superano di poco il 24 per cento di accuratezza. Altri, come GPT-5.2, sono ancora più indietro. Nulla da fare, quindi, se si tratta - ad esempio - di studiare documenti di causa, condurre due diligence complesse, valutare rischi regolatori e coordinare decisioni che dipendono da informazioni incomplete e mutevoli nel corso del tempo.

Avatar di User

Continua a leggere questo Post gratuitamente, offerto da Blast.

Oppure acquista un abbonamento a pagamento.
© 2026 Maggioli · Privacy ∙ Condizioni ∙ Notifica di raccolta
Inizia il tuo SubstackScarica l'app
Substack è la casa della grande cultura