Gerardo Vilcamiza

Senior GenAI Engineer, Docente universitario de IA

Lima, Peru

Actions

¡Hola! Mi nombre es Gerardo y soy Ingeniero Mecatrónico con una Maestría en Inteligencia Artificial Embebida. Actualmente trabajo como Senior AI Engineer en la consultora tecnológica NTT DATA, liderando proyectos de IA generativa, en los que aplicamos modelos de generación de texto, audio e imágenes en soluciones para el sector bancario y asegurador en distintos países de Latinoamérica.

También me desempeño como docente investigador en la Universidad de Buenos Aires, donde dicto cursos de Deep Learning y Visión por Computadora. Además, soy el coordinador principal de todos los cursos de visión por computadora y procesamiento de imágenes de pregrado y posgrado en la Facultad de Ingeniería, y lidero proyectos de investigación en el Laboratorio de Sistemas Embebidos, enfocados en robótica y sistemas satelitales.

Cuento con una trayectoria de 5 años como divulgador internacional de ingeniería e inteligencia artificial, habiendo participado como ponente en eventos realizados en más de 15 países.

Area of Expertise

Information & Communications Technology

Topics

Artificial Intelligence
Data Science
Computer Vision
Large Language Models
Software Development
Cloud Computig
Robotics

Aplicaciones de visión por computadora y GenAI para la accesibilidad

Explora cómo la visión por computadora y la IA generativa se integran para construir soluciones reales de accesibilidad, combinando modelos avanzados con despliegues eficientes en el edge. En esta charla se presentarán sistemas capaces de interpretar la lengua de señas peruana mediante Vision Transformers, así como asistentes para personas con discapacidad visual basados en estimación de profundidad y modelos de image captioning.

Veremos cómo estas soluciones pueden ejecutarse en dispositivos embebidos como Rasberry Pi y Jetson Nano, permitiendo inferencia en tiempo real sin depender completamente de la nube, y en el uso de herramientas y modelos open source que hacen posible desarrollar este tipo de sistemas de manera accesible y escalable. Además, se abordarán los principales desafíos técnicos y de implementación al llevar estas tecnologías desde el laboratorio hasta entornos reales.

Más allá del Chatbot: Arquitecturas multi-agente basadas en IA multimodal para entender el mundo

Durante los últimos años, los chatbots impulsados por LLMs han transformado la forma en que interactuamos con la IA. Sin embargo, muchas aplicaciones reales requieren ir más allá del texto y combinar múltiples tipos de información como imágenes, audio, documentos y video. En este contexto surge un nuevo paradigma: sistemas capaces de integrar diferentes modalidades de datos para comprender mejor su entorno.

En esta charla exploraremos cómo diseñar arquitecturas multi-agente basadas en IA multimodal, donde distintos agentes especializados colaboran entre sí para procesar diferentes tipos de información y resolver tareas complejas de manera coordinada. Analizaremos buenas prácticas de diseño, patrones de arquitectura, estrategias de orquestación entre agentes y cómo estructurar sistemas que integren modelos multimodales dentro de aplicaciones reales.

También revisaremos casos de uso reales basados en mi experiencia en el sector profesional de TI y en investigación universitaria, junto con consideraciones prácticas para construir este tipo de soluciones en entornos modernos de desarrollo, mostrando cómo evolucionar desde simples chatbots hacia sistemas capaces de interpretar múltiples fuentes de información y entender el mundo de manera más completa.

Diseño de Soluciones Reales de Visión e IA Generativa en AWS con Amazon Bedrock

En el ecosistema actual de inteligencia artificial, el verdadero desafío ya no es acceder a modelos avanzados, sino diseñar sistemas completos que funcionen en entornos reales. Un modelo solo no es una solución, la arquitectura que lo rodea es la que determina su escalabilidad, seguridad, costo y calidad.

En esta sesión exploraremos cómo diseñar desde cero soluciones reales de visión e IA generativa en AWS, utilizando Amazon Bedrock como capa de modelos fundacionales dentro de una arquitectura bien estructurada. A través de casos concretos en los que he tenido la oportunidad de participar, analizaremos cómo construir pipelines que integren modelos de lenguaje, agentes, visión por computadora y componentes determinísticos, sin caer en el error de convertir todo en un simple chatbot.

Abordaremos el diseño de arquitecturas RAG empresariales, sistemas multi-agente y pipelines de visión en la nube, poniendo el foco en decisiones clave como selección de modelos, separación de responsabilidades, gobernanza, monitoreo y optimización de costos. Se discutirán patrones de diseño, buenas prácticas y consideraciones críticas para llevar sistemas de IA desde la idea hasta producción.

La charla está orientada a cualquiera que busque entender cómo pensar la IA como un sistema integral sobre AWS, combinando servicios gestionados, orquestación y modelos fundacionales con Amazon Bedrock de forma estratégica y escalable.

Puentes de comunicación: aplicaciones de la IA en accesibilidad para la comunidad sorda en Perú

La inteligencia artificial tiene el potencial de derribar barreras comunicativas y abrir nuevas oportunidades de inclusión. Esta charla presenta el desarrollo de DeepSignBridge, un sistema de traducción en tiempo real de lengua de señas peruana a texto, basado en modelos de visión por computadora, transformers y LLMs.

Abordaremos los principales retos técnicos del proyecto como la creación desde cero del dataset de entrenamiento, el procesamiento de secuencias de video mediante detectores de pose y mecanismos de atención, el diseño de un pipeline optimizado para funcionar en entornos reales y el posprocesamiento de texto usando LLMs. También compartiré los aprendizajes obtenidos en pruebas piloto con instituciones educativas especializadas.

Y más allá de los aspectos tecnológicos, exploraremos cómo Python, la visión por computadora y la IA generativa se convierten en aliados clave para construir soluciones inclusivas, y reflexionaremos sobre cómo proyectos de este tipo pueden escalar para beneficiar a la comunidad sorda en Perú, generando un impacto social tangible.

La audiencia se llevará una visión práctica de cómo aplicar herramientas modernas de IA a problemas inclusivos, un panorama de los desafíos que implica trabajar con datos poco explorados, y la inspiración para desarrollar proyectos que conecten tecnología y accesibilidad.

DeepSignBridge: Traductor de Lenguaje de Señas en Tiempo Real Usando Transformers y Computer Vision

Únete a nosotros en un viaje exploratorio detrás de las cámaras de “DeepSignBridge”, un sistema pionero que traduce el lenguaje de señas peruano a texto en tiempo real. Esta charla te llevará desde los cimientos de nuestro proyecto, comenzando con la exploración de arquitecturas de NLP como LSTM y GRU, pasando por las innovadoras CNN 1-D, hasta culminar en la elección de los Transformers, que revolucionaron nuestro enfoque.

Profundizaremos en los desafíos y las soluciones innovadoras en la detección de poses, destacando el uso de herramientas vanguardistas como MediaPipe y YOLO Pose, que nos permitieron capturar con precisión los gestos complejos del lenguaje de señas. Además, compartiremos nuestras experiencias comparando modelos de vanguardia como ViT y ConvNeXt, y cómo finalmente nos decidimos por MaxViT debido a su excepcional rendimiento y precisión. Además, aprenderemos como el API de ChatGPT nos puede ayudar a mejorar la traducción haciéndola más natural.

Esta charla no solo te mostrará la tecnología detrás de DeepSignBridge, sino también el impacto que la inteligencia artificial puede tener en la creación de un mundo más inclusivo. Descubre cómo la perseverancia, la innovación y la tecnología se unen para tender puentes de comunicación inclusiva.

Bases de datos para modelos generativos

Los modelos generativos, como los grandes modelos de lenguaje y los sistemas de generación de imágenes, no dependen únicamente de arquitecturas avanzadas o grandes volúmenes de cómputo. La calidad, estructura y gestión de los datos juegan un rol decisivo en su desempeño, escalabilidad y confiabilidad.

En esta charla se abordan los fundamentos y buenas prácticas en el diseño de bases de datos orientadas a modelos generativos. Se explorará cómo almacenar, versionar y consultar datos textuales, embeddings y metadatos de forma eficiente, así como el papel de bases de datos vectoriales y relacionales en arquitecturas modernas como RAG y sistemas multiagente. También se discutirán criterios clave como consistencia, trazabilidad, actualización de conocimiento y control de calidad de los datos.

La sesión está dirigida a profesionales y estudiantes de datos e inteligencia artificial que buscan comprender cómo una correcta estrategia de datos impacta directamente en la precisión, robustez y escalabilidad de soluciones basadas en modelos generativos.

Cómo la IA generativa está cambiando al mundo

Se desea abordar con los demás expertos del panel cómo la inteligencia artificial generativa está transformando industrias, redefiniendo la creatividad y cambiando la forma en que trabajamos y nos comunicamos. Se discutirán y explorarán oportunidades, riesgos y los desafíos éticos que acompañan a esta revolución tecnológica.

World Models: enseñando a las máquinas a soñar con el futuro

En esta charla exploraremos el concepto de World Models, una de las ideas más influyentes para avanzar hacia agentes verdaderamente inteligentes. A diferencia de los modelos tradicionales de reinforcement learning, los World Models permiten que una IA aprenda una representación compacta, pero realista, del mundo que la rodea y pueda simular mentalmente escenarios futuros, tal como hacemos los humanos al imaginar antes de actuar.

Revisaremos los fundamentos teóricos sobre modelos generativos de imágenes, video y dinámicas latentes, así como simuladores avanzados. Veremos cómo los nuevos trabajos (por ejemplo, Genie 3 para generación de entornos interactivos, MoSim para predicción física, y META Code World Model para razonar sobre estados de sistema) empujan los límites del concepto clásico. Analizaremos aplicaciones en robótica, videojuegos, ciencia, gemelos digitales, conducción autónoma y generación de código, señalando casos reales y escalables.

Finalmente, discutiremos los retos actuales, desde la eficiencia computacional, el error de modelado, hasta aspectos de seguridad y detección de novedad, y hacia dónde puede llevarnos esta línea de investigación en el desarrollo de agentes autónomos más eficientes, confiables y creativos.

Flisol UTP 2026 Sessionize Event

April 2026 Lima, Peru

AI Developer Day: Build With AI 2026 Sessionize Event

April 2026 Lima, Peru

AWS Student Community Day Perú Sessionize Event

February 2026 Lima, Peru

SQL Saturday Lima - 2026 Sessionize Event

February 2026 Lima, Peru

PyCon Chile 2025 Sessionize Event

November 2025 Viña del Mar, Chile

CodeOn 2025 Sessionize Event

October 2025 Lima, Peru

Gerardo Vilcamiza

Senior GenAI Engineer, Docente universitario de IA

Lima, Peru

Actions

Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.

Speaker

Gerardo Vilcamiza

Actions

Links

Area of Expertise

Topics

Sessions

Aplicaciones de visión por computadora y GenAI para la accesibilidad

Más allá del Chatbot: Arquitecturas multi-agente basadas en IA multimodal para entender el mundo

Diseño de Soluciones Reales de Visión e IA Generativa en AWS con Amazon Bedrock

Puentes de comunicación: aplicaciones de la IA en accesibilidad para la comunidad sorda en Perú

DeepSignBridge: Traductor de Lenguaje de Señas en Tiempo Real Usando Transformers y Computer Vision

Bases de datos para modelos generativos

Cómo la IA generativa está cambiando al mundo

World Models: enseñando a las máquinas a soñar con el futuro

Events

Flisol UTP 2026 Sessionize Event

AI Developer Day: Build With AI 2026 Sessionize Event

AWS Student Community Day Perú Sessionize Event

SQL Saturday Lima - 2026 Sessionize Event

PyCon Chile 2025 Sessionize Event

CodeOn 2025 Sessionize Event

Gerardo Vilcamiza

Links

Actions