ANALISI

Perché le allucinazioni negli LLM sono un rischio per la sicurezza del software

Quando si chiede a un modello di generare codice per risolvere una particolare esigenza, questo potrebbe fornire codice tendenzialmente corretto ma con l’aggiunta di alcune librerie che non esistono, raccomandando quindi pacchetti che non sono pubblicati in un repository legittimo: una porta d’ingresso per i malintenzionati

Pubblicato il 3 set 2024

Federico Riboldi

Project leader di adesso.it

Oggi, uno dei temi più caldi nel mondo dell’innovazione digitale è l’introduzione di strumenti di Generative AI a fianco degli sviluppatori. L’uso di modelli linguistici di grandi dimensioni (LLM) come i modelli GPT 3.5/4/4o, i modelli Gemini o i modelli open source come Llama 3, è diventato sempre più diffuso nel mondo dello sviluppo software.

Il metodo di lavoro Agile, orientato a uno sviluppo del software che risponda ai massimi criteri in termini di qualità e sicurezza, ci guida a individuare rapidamente potenziali falle nel processo di scrittura del codice.

Questi strumenti possono aiutare gli sviluppatori a generare codice per risolvere problemi in modo più rapido ed efficace e rappresentano senza dubbio un’opportunità importante per restare al passo con il mercato, ma fanno emergere anche delle criticità di cyber security a cui tutti gli stakeholder devono porre particolare attenzione.

Indice degli argomenti:

Cosa sono le allucinazioni degli LLM e perché sono un problema

Come sappiamo, uno dei più grossi “limiti” degli LLM è la loro capacità di generare allucinazioni: utilissima per la scrittura creativa, meno utile per la risoluzione di task specifici e ad alto rischio di errore. Questo fenomeno non solo può causare inefficienze, ma rappresenta soprattutto un potenziale rischio per la sicurezza: una porta d’ingresso per potenziali malintenzionati.

Anche se nello sviluppo software le allucinazioni sono ridotte al minimo, un problema grave che sta emergendo riguarda il suggerimento di package o librerie da importare nel codice generato, che possono sembrare plausibili ma che in realtà sono inesatte o completamente inventate.

In poche parole, può capitare che quando si formula una domanda chiedendo ad un modello LLM di generare codice per risolvere una particolare esigenza, il modello risponda con del codice tendenzialmente corretto ma con l’aggiunta di alcune librerie che non esistono, raccomandando quindi pacchetti che non sono pubblicati in un repository legittimo (ad esempio npm, Pypi, ecc.).

L’utente, se attento, si accorge di questa allucinazione ed elimina il pacchetto; se invece esegue il codice si possono avere due scenari:

Il primo (quello fortunato) corrisponde al caso in cui il pacchetto non esiste: in questo caso il codice va in errore e con il debugging si identifica il problema e lo si elimina.
Il secondo avviene quando un hacker ha intercettato questa problematica prima dell’utente e ha pubblicato un pacchetto omonimo contenente codice dannoso che verrà eseguito di nascosto. Una volta eseguito, quel codice può dare accesso all’aggressore a dati sensibili e causare potenziali rischi per la sicurezza dell’applicativo.

Come mitigare i rischi delle allucinazioni negli LLM

È necessario avere un approccio trasversale per mitigare questi rischi:

Formazione su strumenti di Generative AI: diventa fondamentale per un’organizzazione formare in modo adeguato i propri collaboratori sulle nuove tecnologie che entrano a far parte della “cassetta degli attrezzi” con cui vengono svolte le mansioni di tutti i giorni. Ogni strumento può diventare un’arma a doppio taglio se non viene investito del tempo per comprenderne rischi e potenzialità;
Verifica del codice generato: gli sviluppatori devono controllare attentamente il codice generato dagli strumenti di AI. Anche se il codice compila, non significa necessariamente che sia corretto o sicuro. Un controllo manuale è il primo passo per identificare possibili allucinazioni o errori;
Valutazione delle librerie suggerite: indipendentemente da dove proviene il codice che si sta per testare, è sempre buona norma verificare l’affidabilità delle librerie che si stanno importando in un progetto. Questo include controllare la loro versione, il numero di contributori, il livello di manutenzione e le vulnerabilità note. Le librerie open source con una comunità attiva e molte stelle su piattaforme come GitHub sono generalmente più sicure;
Strumenti di analisi statica: integrare strumenti di analisi statica nelle pipeline di CI/CD aiuta a identificare problemi nel codice e nelle librerie proposte. Questi strumenti possono rilevare vulnerabilità e potenziali errori prima che il codice venga implementato;
Test automatici: implementare test automatici è un metodo efficace per verificare il corretto funzionamento del codice e per identificare eventuali regressioni introdotte dal codice suggerito dall’AI;
Assessment di sicurezza regolari: indipendentemente dalla tecnologia utilizzata per produrre il codice, è sempre una buona regola quella di condurre assessment di sicurezza regolari, soprattutto per applicazioni web e mobili esposte su Internet. Questo aiuta a identificare e mitigare potenziali vulnerabilità;
Adottare un approccio Agile allo sviluppo software: in ultimo è sempre utile ricordare come l’adozione di metodologie Agile consenta di mitigare questi rischi. Adottare un approccio strutturato con cicli brevi nella verifica e valutazione del codice consente di identificare e correggere tempestivamente le problematiche, riducendo il rischio di errori sistematici.

Conclusioni

È fondamentale che gli sviluppatori acquisiscano una profonda consapevolezza delle limitazioni degli strumenti di AI e si impegnino in una continua formazione e aggiornamento su queste tecnologie.

Porsi le giuste domande riguardo agli strumenti utilizzati, come ad esempio la loro affidabilità e le loro potenziali debolezze, diventa più che mai cruciale.

Adottando le migliori pratiche nella progettazione e gestione dei progetti, come le metodologie Agile, e mantenendo una costante attenzione alla sicurezza, è possibile migliorare l’affidabilità dei progetti software basati su AI.

@RIPRODUZIONE RISERVATA