Gerardo Vilcamiza
Senior GenAI Engineer, Docente universitario de IA
Senior GenAI Engineer, Docente universitario de IA
Lima, Peru
Actions
¡Hola! Mi nombre es Gerardo y soy Ingeniero Mecatrónico con una Maestría en Inteligencia Artificial Embebida. Actualmente trabajo como Senior GenAI Engineer en la consultora tecnológica NTT DATA, liderando proyectos de IA generativa, en los que aplicamos modelos de generación de texto, audio e imágenes en soluciones para el sector bancario y asegurador de diferentes entidades por toda Latinoamérica.
También me desempeño como docente investigador en la Universidad de Buenos Aires, donde dicto cursos de Deep learning, Visión por Computadora y NLP. Además, lidero proyectos de investigación en el Laboratorio de Sistemas Embebidos de la FIUBA orientados a la robótica y sistemas satelitales.
Mi pasión por la IA me ha llevado a muchos lugares, siendo speaker en congresos y eventos organizados por IEEE (Institute of Electrical and Electronics Engineers) y comunidades de Python y AWS en diversos países. Teniendo ya una carrera de más de 4 años como divulgador internacional de ingeniería e inteligencia artificial.
¡Hola! Mi nombre es Gerardo y soy Ingeniero Mecatrónico con una Maestría en Inteligencia Artificial Embebida. Actualmente trabajo como Senior GenAI Engineer en la consultora tecnológica NTT DATA, liderando proyectos de IA generativa, en los que aplicamos modelos de generación de texto, audio e imágenes en soluciones para el sector bancario y asegurador de diferentes entidades por toda Latinoamérica.
También me desempeño como docente investigador en la Universidad de Buenos Aires, donde dicto cursos de Deep learning, Visión por Computadora y NLP. Además, lidero proyectos de investigación en el Laboratorio de Sistemas Embebidos de la FIUBA orientados a la robótica y sistemas satelitales.
Mi pasión por la IA me ha llevado a muchos lugares, siendo speaker en congresos y eventos organizados por IEEE (Institute of Electrical and Electronics Engineers) y comunidades de Python y AWS en diversos países. Teniendo ya una carrera de más de 4 años como divulgador internacional de ingeniería e inteligencia artificial.
Area of Expertise
Topics
Más allá del Chatbot: Arquitecturas multi-agente basadas en IA multimodal para entender el mundo
Durante los últimos años, los chatbots impulsados por LLMs han transformado la forma en que interactuamos con la IA. Sin embargo, muchas aplicaciones reales requieren ir más allá del texto y combinar múltiples tipos de información como imágenes, audio, documentos y video. En este contexto surge un nuevo paradigma: sistemas capaces de integrar diferentes modalidades de datos para comprender mejor su entorno.
En esta charla exploraremos cómo diseñar arquitecturas multi-agente basadas en IA multimodal, donde distintos agentes especializados colaboran entre sí para procesar diferentes tipos de información y resolver tareas complejas de manera coordinada. Analizaremos buenas prácticas de diseño, patrones de arquitectura, estrategias de orquestación entre agentes y cómo estructurar sistemas que integren modelos multimodales dentro de aplicaciones reales.
También revisaremos casos de uso reales basados en mi experiencia en el sector profesional de TI y en investigación universitaria, junto con consideraciones prácticas para construir este tipo de soluciones en entornos modernos de desarrollo, mostrando cómo evolucionar desde simples chatbots hacia sistemas capaces de interpretar múltiples fuentes de información y entender el mundo de manera más completa.
Diseño de Soluciones Reales de Visión e IA Generativa en AWS con Amazon Bedrock
En el ecosistema actual de inteligencia artificial, el verdadero desafío ya no es acceder a modelos avanzados, sino diseñar sistemas completos que funcionen en entornos reales. Un modelo solo no es una solución, la arquitectura que lo rodea es la que determina su escalabilidad, seguridad, costo y calidad.
En esta sesión exploraremos cómo diseñar desde cero soluciones reales de visión e IA generativa en AWS, utilizando Amazon Bedrock como capa de modelos fundacionales dentro de una arquitectura bien estructurada. A través de casos concretos en los que he tenido la oportunidad de participar, analizaremos cómo construir pipelines que integren modelos de lenguaje, agentes, visión por computadora y componentes determinísticos, sin caer en el error de convertir todo en un simple chatbot.
Abordaremos el diseño de arquitecturas RAG empresariales, sistemas multi-agente y pipelines de visión en la nube, poniendo el foco en decisiones clave como selección de modelos, separación de responsabilidades, gobernanza, monitoreo y optimización de costos. Se discutirán patrones de diseño, buenas prácticas y consideraciones críticas para llevar sistemas de IA desde la idea hasta producción.
La charla está orientada a cualquiera que busque entender cómo pensar la IA como un sistema integral sobre AWS, combinando servicios gestionados, orquestación y modelos fundacionales con Amazon Bedrock de forma estratégica y escalable.
Puentes de comunicación: aplicaciones de la IA en accesibilidad para la comunidad sorda en Perú
La inteligencia artificial tiene el potencial de derribar barreras comunicativas y abrir nuevas oportunidades de inclusión. Esta charla presenta el desarrollo de DeepSignBridge, un sistema de traducción en tiempo real de lengua de señas peruana a texto, basado en modelos de visión por computadora, transformers y LLMs.
Abordaremos los principales retos técnicos del proyecto como la creación desde cero del dataset de entrenamiento, el procesamiento de secuencias de video mediante detectores de pose y mecanismos de atención, el diseño de un pipeline optimizado para funcionar en entornos reales y el posprocesamiento de texto usando LLMs. También compartiré los aprendizajes obtenidos en pruebas piloto con instituciones educativas especializadas.
Y más allá de los aspectos tecnológicos, exploraremos cómo Python, la visión por computadora y la IA generativa se convierten en aliados clave para construir soluciones inclusivas, y reflexionaremos sobre cómo proyectos de este tipo pueden escalar para beneficiar a la comunidad sorda en Perú, generando un impacto social tangible.
La audiencia se llevará una visión práctica de cómo aplicar herramientas modernas de IA a problemas inclusivos, un panorama de los desafíos que implica trabajar con datos poco explorados, y la inspiración para desarrollar proyectos que conecten tecnología y accesibilidad.
DeepSignBridge: Traductor de Lenguaje de Señas en Tiempo Real Usando Transformers y Computer Vision
Únete a nosotros en un viaje exploratorio detrás de las cámaras de “DeepSignBridge”, un sistema pionero que traduce el lenguaje de señas peruano a texto en tiempo real. Esta charla te llevará desde los cimientos de nuestro proyecto, comenzando con la exploración de arquitecturas de NLP como LSTM y GRU, pasando por las innovadoras CNN 1-D, hasta culminar en la elección de los Transformers, que revolucionaron nuestro enfoque.
Profundizaremos en los desafíos y las soluciones innovadoras en la detección de poses, destacando el uso de herramientas vanguardistas como MediaPipe y YOLO Pose, que nos permitieron capturar con precisión los gestos complejos del lenguaje de señas. Además, compartiremos nuestras experiencias comparando modelos de vanguardia como ViT y ConvNeXt, y cómo finalmente nos decidimos por MaxViT debido a su excepcional rendimiento y precisión. Además, aprenderemos como el API de ChatGPT nos puede ayudar a mejorar la traducción haciéndola más natural.
Esta charla no solo te mostrará la tecnología detrás de DeepSignBridge, sino también el impacto que la inteligencia artificial puede tener en la creación de un mundo más inclusivo. Descubre cómo la perseverancia, la innovación y la tecnología se unen para tender puentes de comunicación inclusiva.
Bases de datos para modelos generativos
Los modelos generativos, como los grandes modelos de lenguaje y los sistemas de generación de imágenes, no dependen únicamente de arquitecturas avanzadas o grandes volúmenes de cómputo. La calidad, estructura y gestión de los datos juegan un rol decisivo en su desempeño, escalabilidad y confiabilidad.
En esta charla se abordan los fundamentos y buenas prácticas en el diseño de bases de datos orientadas a modelos generativos. Se explorará cómo almacenar, versionar y consultar datos textuales, embeddings y metadatos de forma eficiente, así como el papel de bases de datos vectoriales y relacionales en arquitecturas modernas como RAG y sistemas multiagente. También se discutirán criterios clave como consistencia, trazabilidad, actualización de conocimiento y control de calidad de los datos.
La sesión está dirigida a profesionales y estudiantes de datos e inteligencia artificial que buscan comprender cómo una correcta estrategia de datos impacta directamente en la precisión, robustez y escalabilidad de soluciones basadas en modelos generativos.
Cómo la IA generativa está cambiando al mundo
Se desea abordar con los demás expertos del panel cómo la inteligencia artificial generativa está transformando industrias, redefiniendo la creatividad y cambiando la forma en que trabajamos y nos comunicamos. Se discutirán y explorarán oportunidades, riesgos y los desafíos éticos que acompañan a esta revolución tecnológica.
World Models: enseñando a las máquinas a soñar con el futuro
En esta charla exploraremos el concepto de World Models, una de las ideas más influyentes para avanzar hacia agentes verdaderamente inteligentes. A diferencia de los modelos tradicionales de reinforcement learning, los World Models permiten que una IA aprenda una representación compacta, pero realista, del mundo que la rodea y pueda simular mentalmente escenarios futuros, tal como hacemos los humanos al imaginar antes de actuar.
Revisaremos los fundamentos teóricos sobre modelos generativos de imágenes, video y dinámicas latentes, así como simuladores avanzados. Veremos cómo los nuevos trabajos (por ejemplo, Genie 3 para generación de entornos interactivos, MoSim para predicción física, y META Code World Model para razonar sobre estados de sistema) empujan los límites del concepto clásico. Analizaremos aplicaciones en robótica, videojuegos, ciencia, gemelos digitales, conducción autónoma y generación de código, señalando casos reales y escalables.
Finalmente, discutiremos los retos actuales, desde la eficiencia computacional, el error de modelado, hasta aspectos de seguridad y detección de novedad, y hacia dónde puede llevarnos esta línea de investigación en el desarrollo de agentes autónomos más eficientes, confiables y creativos.
AI Developer Day: Build With AI 2026 Sessionize Event Upcoming
AWS Student Community Day Perú Sessionize Event
SQL Saturday Lima - 2026 Sessionize Event
PyCon Chile 2025 Sessionize Event
CodeOn 2025 Sessionize Event
Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.
Jump to top