AI Generativa

GPT-4 per gli avvocati supera tutti gli altri chatbot

Il modello di OpenAI è stato testato con LegalBench, che valuta la capacità dei chatbot AI di svolgere sei diversi tipi di ragionamento legale. Messi alla prova, GPT-4 ha ottenuto i risultati migliori. Ma l’AI non è pronta a gestire le complessità delle argomentazioni legali del mondo reale

Pubblicato il 11 set 2023

Pierluigi Sandonnini

giornalista

Il modello GPT-4 di OpenAI ha superato altri chatbot in un test di ragionamento legale condotto da LegalBench. Nonostante il successo, non è ancora all’altezza delle competenze richieste agli avvocati umani, soprattutto nel richiamo di informazioni e norme giuridiche specifiche.
LegalBench è stato progettato da ricercatori di intelligenza artificiale e avvocati per valutare la capacità dei chatbot di svolgere compiti pratici legali. Comprende 162 compiti e ha valutato 20 modelli linguistici, con GPT-4 che ha ottenuto i migliori risultati, anche se non perfetti.
L’adozione dell’AI nei contesti legali presenta sfide significative, tra cui costi, gestione dei rischi e sicurezza delle informazioni. Inoltre, solleva questioni etiche come la pratica legale non autorizzata e la gestione dei diritti d’autore. Gli studi legali, come Allen & Overy, stanno testando l’AI, ma mantengono l’intervento umano per garantire precisione e conformità legale.

@RIPRODUZIONE RISERVATA