Session
GenAI in produzione: best practice per garantire valore.
Lo sviluppo di un progetto di intelligenza artificiale generativa (genAI) da un semplice Proof of Concept (PoC) o demo a una soluzione robusta e pronta per la produzione è un processo complesso pieno di numerose sfide.
Questo talk mira a guidare i partecipanti attraverso le complessità del dimensionamento dei progetti genAI, evidenziando le insidie comuni e le soluzioni strategiche.
In questo talk presentiamo un'architettura completa per i progetti genAI, che copre aspetti essenziali come il controllo delle versioni dei prompt e la definizione delle guardrail, la gestione delle conversazioni, la selezione di database vettoriali e la valutazione del modello.
Vedremo anche quali strumenti AWS mette a disposizione, utilizzando la suite Bedrock.
Infine mostreremo come queste tecniche sono state applicate in un caso reale nell'implementazione di un sistema di Retrieval-Augmented Generation (RAG) integrato con Bedrock Knowledge con a cui sono state apportate modifiche necessarie al mantenimento in produzione di un livello qualitativo adeguato quali prompt versioning, chunking ottimizzato della knowledge base, cronologia delle conversazioni e applicazione degli agenti per migliorare l'outpuut.

Luca Bianchi
Chief Technology Officer @ Neosperience Spa, AWS Serverless Hero, AWS re:Invent 2022 speaker, ServerlessDays Italy and Serverless Meetup Italy co-organizer
Milan, Italy
Links
Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.
Jump to top