Riccardo Zoncada

Software Engineer @ xtream

Milan, Italy

Actions

Software Engineer @ xtream dove mi occupo di sviluppo software per prodotti digitali, con una predilezione per il mondo backend. Sono molto curioso, abbraccio e lascio nuove passioni molto velocemente, le uniche costanti da sempre sono l'ingegneria del software, la musica elettronica e la MTB.

Area of Expertise

Information & Communications Technology

Topics

NodeJS
Backend
JavaScript & TypeScript
Software Engineering
Software Architecture
python

Sessions

LLM Local Inference: Tools, Techniques, and Insights en it

Over the past few months, I’ve had the chance to work on a research and development project exploring the feasibility of adopting solutions powered by Small and Large Language Models—with one unique twist: inference had to be performed at the edge.

This journey led me to scratch the surface of the vast, fascinating, and rapidly evolving world of LLMs, with a particular focus on inference servers. Along the way, I encountered a fair share of head-scratching moments and valuable insights that I’m excited to share with you.

In this talk, we’ll cover the key concepts behind LLM inference, untangle the tricky jargon, and give you a glimpse into the primary tools and solutions you can leverage if you ever need or want to explore LLM local inference.

- Working Software 2025 https://www.agilemovement.it/workingsoftware/schedule.html
- We Are Developers World Congress 2025

Inferenza locale LLMs: Strumenti, Tecniche e Spunti en it

Negli ultimi mesi ho avuto l’opportunità di lavorare a un progetto di ricerca e sviluppo per esplorare l’adozione di soluzioni basate su Small e Large Language Models, con una sfida particolare: eseguire l’inferenza localmente, “on edge”.

Durante questo progetto, ho approfondito vari aspetti di un ecosistema complesso e in rapida evoluzione, concentrandomi in particolare sui server di inferenza. Ho affrontato sfide non banali, scoperto strumenti e tecniche utili, e raccolto molte idee che penso possano essere interessanti da condividere.

In questa sessione esploreremo le principali componenti dello stack di inferenza locale per LLM. Partiremo dal chiarire il gergo tecnico, passando in rassegna i principali progetti open source dell’ecosistema e presentando strumenti e soluzioni pratiche per chi vuole orientarsi e iniziare a sperimentare in questo ambito.

- Working Software 2025 https://www.agilemovement.it/workingsoftware/schedule.html
- We Are Developers World Congress 2025

Agents, Assemble! GenAI on steroids with Autogen and multi agents en

Quasi ogni prodotto digitale attualmente in sviluppo sta introducendo GenAI sotto qualche forma. Ma quante di queste applicazioni ne sfruttano al 100% le potenzialità?

In questo workshop, il nostro percorso partirà da un'app di esempio realizzata a partire dal gpt-4o o l'o1 di OpenAI, chiamato via api a singolo prompt. Da lì, porteremo il nostro prodotto su nuove vette utilizzando AutoGen e AutoGen Studio.

Questo framework ci aiuterà a rendere passo dopo passo il nostro flusso di generazione più sofisticato, sfruttando agenti LLM specializzati che collaborano tra loro per ottenere risultati di maggiore profondità e precision.

Vedremo come sfruttare AutoGen Studio per prototipare rapidamente questi flussi, e come introdurli nella nostra applicazione disaccoppiandoli dal resto della codebase.

Alla fine del workshop, i partecipanti avranno un'idea precisa del vantaggio nell'utilizzare un paradigma multi-agents, con strumenti pratici per sperimentarlo nei loro prodotti.

- Codemotion Conference Milan 2024 https://conferences.codemotion.com/milan2024/workshop-2/

Create your own v0™ exploiting generative AI en it

Generative AI is revolutionizing software development. The recent release of Vercel's v0™ is just one of many examples. It's impressive! However, every company has its own design system, component library, and internal standards, which v0™ does not support (yet).

In this workshop, we aim to collaboratively build a simplified version of v0™. This version will be able to generate code from text prompts that use a specific component library and adhere to a design system, leveraging some of the most common patterns in LLM-based app development (RAG, in-context learning, multi-stage reasoning).

By the end, we'll have gained an understanding of some basic techniques for integrating Generative AI into a software project and how it can be used to support our everyday dev work.

- Codemotion Workshops Fest 2024: https://dub.sh/codemotion-x0-talk
- GitHub repository: https://dub.sh/codemotion-x0-repo

Create your own v0™ exploiting generative AI en it

L'AI generativa sta rivoluzionando lo sviluppo del software. Il recente rilascio di v0™ da parte di Vercel è uno dei tanti esempi. Bellissimo! Peccato però che ogni azienda adotta un suo design system, una sua libreria di componenti, i suoi standard interni, che v0™ attualmente non supporta.

In questo workshop costruiremo insieme una versione semplificata di v0™, in grado di generare a partire da prompt testuali del codice che utilizzi una specifica libreria di componenti e che aderisca ad un design system. Per farlo ci avvarremo degli ultimi modelli Google Gemini e sfrutteremo alcuni dei più comuni pattern dello sviluppo di app basate su LLM (Retrieval-Augmented Generation, in-context learning, multi-stage reasoning).

Alla fine avremo compreso alcune tecniche di base per l’integrazione dell'AI generativa in un progetto software e come si potrebbe sfruttare per il supporto al lavoro di tutti i giorni come sviluppatori web.

- Codemotion Workshops Fest 2024: https://dub.sh/codemotion-x0-talk
- GitHub repository: https://dub.sh/codemotion-x0-repo
- Requirements: basics of web programming with React and Nodejs

Principi SOLID e come applicarli it

I cinque principi “ SOLID” (Single responsibility, Open-closed, Liskov substitution, Interface segregation, Dependency inversion) sono linee guida per la progettazione di componenti software. La loro corretta applicazione aiuta a produrre codice di elevata qualità, che sia se mplice da capire, estendere e modificare, e ad evitare inutili complessità e pericolose duplicazioni. Descritti per la prima volta da Robert C. Martin nei primi anni 2000, i principi SOLID sono ancora oggi poco conosciuti e troppo spesso violati.
In questo seminario, analizzeremo e miglioreremo una semplice applicazione Java che, pur essendo perfettamente funzionante, non rispetta i principi. In particolare, ci focalizzeremo su Single responsibility e Open-closed, discutendo le conseguenze della loro viol azione. Dopo una breve introduzione teorica, mostreremo come modificare le classi dell’applicazione in modo da avvicinarla ad un pieno rispetto dei principi in una sessione di live coding.

- Seminario del corso di Programmazione ad Oggetti 2022/2023 presso la Facoltà di Scienze Matematiche, Fisiche e Naturali dell'Università Cattolica del Sacro Cuore di Brescia.

WeAreDevelopers World Congress 2025 Sessionize Event

July 2025 Berlin, Germany

Working Software 2025 Sessionize Event

June 2025 Reggio nell'Emilia, Italy

Codemotion Milan 2024 Sessionize Event

October 2024 Milan, Italy

Riccardo Zoncada

Software Engineer @ xtream

Milan, Italy

Actions

Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.

Speaker

Riccardo Zoncada

Actions

Links

Area of Expertise

Topics

Sessions

LLM Local Inference: Tools, Techniques, and Insights en it

Inferenza locale LLMs: Strumenti, Tecniche e Spunti en it

Agents, Assemble! GenAI on steroids with Autogen and multi agents en

Create your own v0™ exploiting generative AI en it

Create your own v0™ exploiting generative AI en it

Principi SOLID e come applicarli it

Events

WeAreDevelopers World Congress 2025 Sessionize Event

Working Software 2025 Sessionize Event

Codemotion Milan 2024 Sessionize Event

Riccardo Zoncada

Links

Actions