Session
AI nel browser: come far girare il tuo modello locale con WebLLM e Angular
E se il tuo modello AI potesse girasse direttamente nel browser, senza chiamate a server, senza token, senza latenza di rete? WebLLM rende possibile tutto questo: esegue modelli linguistici quantizzati direttamente nel browser, sfruttando WebGPU, senza che un singolo token esca dalla macchina dell'utente.
In questo talk vi racconto come l'ho integrato in Angular, partendo da un esperimento e arrivando a un gioco funzionante con NPC alimentati da un LLM locale.
Esploreremo insieme come funziona WebLLM, come l’ho integrato in Angular, e quali strategie ho usato per gestirne i limiti e tirarne fuori il massimo.
Davide Passafaro
Google Developer Expert in Angular ❮ ❯ | Senior Software Engineer 💻📱 | GDG Roma Città Organizer 📣
Rome, Italy
Links
Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.
Jump to top