Session

Personalizzare l'IA per il Diritto: Addestrare Modelli su Dataset Legali

L’intelligenza artificiale può essere adattata per compiti specifici tramite il fine-tuning di modelli pre-addestrati, trasformandoli in strumenti altamente specializzati. In questo talk presenterò un progetto pratico basato su GPT-2, personalizzato per comprendere e generare testi giuridici, con un focus sull’interpretazione del Codice Civile e Penale e sulla creazione automatizzata di querele. Il progetto sfrutta tecnologie open source per ottimizzare un modello di linguaggio già esistente, rendendolo capace di rispondere a domande legali e generare documenti strutturati con un linguaggio formale e contestualizzato.
Durante l’intervento illustrerò il workflow seguito, suddiviso in tre fasi principali. La prima riguarda la preparazione del dataset, che prevede l’estrazione dei testi normativi tramite web scraping e parsing, seguita dalla pulizia e tokenizzazione del testo con NLTK e Hugging Face Tokenizers, per garantire un’elaborazione efficace del linguaggio giuridico. La seconda fase si concentra sul fine-tuning di GPT-2, eseguito con PyTorch e TensorFlow per adattare il modello al dominio legale. Verranno ottimizzati iperparametri chiave come batch size, learning rate ed epoche, applicando tecniche di early stopping e gradient accumulation per migliorare le prestazioni su hardware limitato. Infine, nella terza fase, verrà presentata l’interfaccia web, sviluppata con Flask, che consente agli utenti di inserire domande giuridiche o descrivere un caso, ricevendo in risposta un’analisi legale dettagliata o una bozza di querela generata automaticamente dal modello.
Il talk si concluderà con una demo live, dimostrando come la personalizzazione di GPT-2 possa trasformare un modello generico in uno strumento avanzato per il settore giuridico. L'obiettivo è mostrare come sia possibile adattare un LLM alle esigenze specifiche di qualsiasi organizzazione o settore.

Daniele Mario Areddu

AI & Big Data Enthusiast | Freelance Full-Stack & Java Developer | Student @ ITIS Vallauri Velletri | Digital Culture & Change Model Specialist @ UNIDEA | Indie Author @ KDP

Velletri, Italy

Actions

Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.

Jump to top