Maciej Kępa
Data Architect @ Datumo
Data Architect @ Datumo
Kraków, Poland
Actions
Senior Data Engineer and Data Architect at Datumo. He has dedicated his career to the fields of AI/ML, edge devices, and IoT. Professionally focused on designing and implementing solutions primarily based on the Azure cloud. A strong advocate of data-centric AI. Privately, an animal lover, gaming enthusiast, and DIY hobbyist.
Senior Data Engineer oraz Data Architect w Datumo, który od lat rozwija swoją karierę w obszarach AI/ML, urządzeń brzegowych (Edge) oraz IoT. Specjalizuje się w projektowaniu i wdrażaniu zaawansowanych rozwiązań opartych głównie na chmurze Azure. Jest gorącym zwolennikiem podejścia Data-centric AI, stawiającego jakość danych w centrum procesów budowania modeli. Prywatnie miłośnik zwierząt, fan gamingu i pasjonat majsterkowania (DIY).
Area of Expertise
Topics
SQL Server and the Vector Revolution - how LLMs see your data en pl
SQL Server 2025 opens a new chapter: support for vector databases - a key component powering Large Language Models (LLMs) and modern AI solutions. But what exactly are vectors? How does text, an image, or code become a row of numbers? What are embeddings, and why are they so critical for semantic processing?
In this session, I’ll explore:
- how LLMs "understand" data,
- what embeddings are and how to create them,
- how to store and search vector data in SQL Server 2025,
- and why a vector database is more than just a new data type.
This session will be rooted in practical scenarios and live demos - no unnecessary math, just a clear focus on bridging traditional data approaches with cutting-edge AI capabilities. If you want to start building solutions today that are ready for tomorrow, this session is for you.
SQL Server i wektorowa rewolucja, czyli jak LLM widzi Twoje dane en pl
SQL Server 2025 otwiera nowy rozdział - obsługę baz wektorowych, kluczowego elementu napędzającego Duże Modele Językowe (LLM) i nowoczesne rozwiązania AI. Ale czym właściwie są wektory? Jak tekst, obraz czy kod staje się rzędem liczb? Co to są embeddingi i dlaczego są tak istotne w przetwarzaniu semantycznym?
W trakcie tej sesji zaprezentuję:
- jak LLM-y „rozumieją” dane,
- czym są embeddingi i jak można je tworzyć,
- jak przechowywać i przeszukiwać dane wektorowe w SQL Server 2025,
- oraz dlaczego baza wektorowa to coś więcej niż tylko nowy typ danych.
Całość osadzona będzie w praktycznych scenariuszach i demo - bez zbędnej matematyki, za to z naciskiem na zrozumienie tego, jak połączyć klasyczne podejście do danych z nowoczesnymi możliwościami AI. Jeśli chcesz dowiedzieć się, jak już dziś budować rozwiązania gotowe na jutro - ta sesja jest dla Ciebie.
Understand your data landscape with Observability platform en pl
Data is the foundation of modern organizations, yet its growing scale and complexity make it increasingly difficult to manage. What data do we have? Where is it stored? How is it processed - and can it be trusted? These are questions many companies struggle to answer. Without full visibility into the data ecosystem, it's hard to make informed decisions, eliminate errors, or meet regulatory requirements.
The solution in such cases is a Data Observability platform - a tool that provides comprehensive visibility, monitoring, and diagnostics across the entire data landscape. This allows organizations to better understand how their data is used and governed, improving its quality and reliability.
In this session, we’ll share how we designed and implemented a Data Observability platform in Azure for a pharmaceutical client, with the core goal of understanding where data lives, what processes affect it, and who uses it. We’ll discuss the industry-specific challenges, technical complexities, and practical takeaways based on key monitoring pillars. This session will offer inspiration and real-world examples to help any organization gain better control over its data environment.
A Hitchhiker's guide to AI/ML en pl
Artificial intelligence and machine learning have become foundational technologies in the modern IT world. While the abundance of available materials, frameworks, and ready-made solutions suggests it’s never been easier to begin, the reality is often more complex. An overwhelming number of options can make it difficult to choose the right path from the start.
In this debate-style session, we’ll explore various approaches to getting started with AI/ML. We'll discuss key tools and resources that make it easier to take your first steps in the field, and examine how to distinguish between solutions that truly move you forward and those that might mislead or slow your progress.
Through real-world examples, we’ll highlight common mistakes and challenges faced by beginners, and share proven ways to avoid them - so your journey into AI/ML is effective, inspiring, and full of opportunity.
You’ll leave this session with a clear action plan, equipped with the knowledge, tools, and confidence to enter the world of AI/ML in the right direction.
MLOps on Azure - war stories and lessons learned en pl
Nearly 80% of AI/ML projects end in failure. Surprising? In a world where AI is booming and solution blueprints are just a click away, building and deploying a machine learning model should be easy - right?
In reality, getting an AI solution into production and keeping it there is a minefield. That’s where MLOps comes in: a set of principles and practices designed to keep your project alive from proof of concept to scalable deployment. Ignore them, and your AI might never leave the sandbox.
This session dives into what MLOps really looks like in the wild. Through real-world “war stories” from refactoring a Computer Vision system on Azure - deployed on edge devices in pharmaceutical plants - you’ll learn why AI systems fail, how to avoid technical debt, and what practices are essential for operationalizing ML at scale. If you're working with AI on Azure, this session will help you connect theory to production reality.
MLOps on Azure - war stories and lessons learned en pl
Około 80% projektów z dziedziny AI/ML kończy się porażką. Statystyka ta może wydawać się zaskakująca - AI jest teraz tak popularne, blueprinty gotowych rozwiązań tak łatwo dostępne, jak trudne może być zbudowanie modelu uczenia maszynowego i wystawienie go na produkcję?
MLOps jest zestawem zasad i najlepszych praktyk mającym zapewnić powodzenie projektu AI w całym cyklu jego życia. Niezrozumienie lub niewłaściwe zastosowanie tych praktyk może sprawić, że również i nasze wdrożenie prędzej czy później utknie w martwym punkcie bez odwrotu.
W trakcie tej sesji omówię czym jest MLOps, na jakich filarach stoi i jak na tych filarach z powodzeniem opierać wdrażane rozwiązanie. Przedstawię również przykłady "z życia wzięte" jak odejście od fundamentów rzutuje na jakość całego systemu. Całość w formie historii wojennych z projektu refaktoryzacji systemu Computer Vision opartego o serwisy chmurowe Azure wdrożonego na urządzeniach brzegowych dwóch zakładów farmaceutycznych.
AI/ML na początek - Twoja mapa startowa w świecie sztucznej inteligencji en pl
Sztuczna inteligencja i uczenie maszynowe to technologie, które stały się fundamentem nowoczesnego świata IT. Choć mnogość dostępnych materiałów, frameworków i gotowych rozwiązań sugeruje, że nigdy nie było łatwiej zacząć, rzeczywistość często okazuje się bardziej skomplikowana. Przytłaczająca liczba opcji potrafi utrudnić wybór odpowiedniego kierunku na starcie.
Podczas tej sesji, w formule debaty, przyjrzymy się różnym podejściom do rozpoczęcia pracy z AI/ML. Omówimy kluczowe narzędzia i zasoby, które ułatwią postawienie pierwszych kroków w tej dziedzinie. Zastanowimy się, jak odróżnić rozwiązania prowadzące do celu od tych, które mogą zmylić i spowolnić rozwój.
Na konkretnych, życiowych przykładach pokażemy najczęstsze błędy i wyzwania, z jakimi mierzą się początkujący. Podzielimy się sprawdzonymi sposobami ich unikania, aby start w AI/ML był skuteczny, inspirujący i pełen nowych możliwości.
Wyjdziesz z tej sesji z jasnym planem działania, gotowy świadomie wkroczyć w świat AI/ML – z wiedzą, narzędziami i pewnością, że obrałeś właściwy kierunek.
Understand your data landscape with Observability platform en pl
Dane to fundament nowoczesnych organizacji, ale ich rosnąca skala i złożoność sprawiają, że zarządzanie nimi staje się coraz trudniejsze. Jakie dane posiadamy, gdzie są przechowywane, jak są przetwarzane i czy można im zaufać – to pytania, na które wiele firm nie potrafi jednoznacznie odpowiedzieć. Bez pełnego wglądu w ekosystem danych trudno jest podejmować świadome decyzje, eliminować błędy czy spełniać regulacyjne wymagania.
W takich sytuacjach rozwiązaniem jest platforma Data Observability – narzędzie zapewniające pełną widoczność, monitorowanie i diagnozowanie problemów w całym krajobrazie danych. Dzięki temu organizacje mogą lepiej zrozumieć, jak ich dane są wykorzystywane i zarządzane, oraz zwiększyć ich jakość i niezawodność.
W tej sesji omówimy, jak zaprojektowaliśmy i wdrożyliśmy platformę Data Observability na chmurze Azure dla klienta z branży farmaceutycznej, gdzie kluczowym celem było zrozumienie, gdzie znajdują się dane, jakie procesy na nie wpływają i kto z nich korzysta. Opowiemy o wyzwaniach technologicznych, specyfice branży oraz praktycznych wskazówkach związanych z budową rozwiązania opartego na konkretnych filarach monitoringu. Sesja dostarczy inspiracji i konkretnych przykładów zastosowania, które mogą być pomocne w lepszym zarządzaniu danymi w każdej organizacji.
Databricks Overwatch - the Dashboard that sees everything en pl
Effective management of a Databricks environment requires continuous monitoring and analysis of key operational metrics. If you’ve ever wondered how to achieve this, we have the solution - Databricks Overwatch. Overwatch is an open-source tool that provides full visibility into what’s happening within your Databricks environment.
During this session:
- You will learn the theory behind Overwatch – what it exactly is, which real problems it solves, and why it’s worth implementing.
- Step by step, you will configure your own Overwatch job - you’ll see how easy it is to start collecting key data, from installation through integration with the Databricks platform.
- You will discover the power of dashboards and visualizations – you’ll explore example dashboards that help you quickly identify issues, optimize costs, and boost cluster performance.
- Lessons learned from production - you’ll receive valuable tips and insights gained from deploying Overwatch in large-scale production environments.
By the end of the session, you’ll be ready to independently implement and fully leverage the potential of Databricks Overwatch in your environment.
Databricks Overwatch - Dashboard, który widzi wszystko en pl
Efektywne zarządzanie środowiskiem Databricks wymaga ciągłego monitoringu i analizy kluczowych metryk operacyjnych. Jeżeli zastanawiałeś się kiedyś, jak to zrobić to mamy rozwiązanie - Databricks Overwatch. Overwatch to narzędzie open-source, które zapewnia pełną widoczność tego, co dzieje się w Twoim środowisku Databricks.
W trakcie tej sesji:
- Poznasz tajniki teorii Overwatch - dowiesz się, czym dokładnie jest, jakie realne problemy rozwiązuje oraz dlaczego warto go wdrożyć.
- Krok po kroku skonfigurujesz swój własny job Overwatch - zobaczysz, jak łatwo uruchomić zbieranie kluczowych danych, od instalacji aż po integrację z platformą Databricks.
- Odkryjesz moc dashboardów i wizualizacji - poznasz przykładowe dashboardy, dzięki którym szybko zidentyfikujesz problemy, zoptymalizujesz koszty oraz zwiększysz wydajność klastrów.
- Lessons learned z produkcji - otrzymasz cenne wskazówki i doświadczenia zdobyte podczas wdrożeń Overwatch w dużych środowiskach produkcyjnych.
Po zakończeniu sesji będziesz gotowy, by samodzielnie wdrożyć oraz maksymalnie wykorzystać potencjał Databricks Overwatch w swoim środowisku.
BigQuery, Vertex AI or Databricks? Don’t choose - combine them! en pl
Companies adopting AI in the cloud often face a tool-selection dilemma: BigQuery for analytics, Databricks for data processing and MLOps, Vertex AI for training and serving models. Each has its strengths, but without cohesive integration you end up with silos, rising costs and governance headaches.
In this presentation, I’ll walk through a project where we built a complete AI platform in Google Cloud for a major financial institution, bringing BigQuery, Databricks and Vertex AI together into a single ecosystem. I’ll show the reference architecture, integration with CI/CD and private Git repositories, Terraform-based IaC, and how we tackled challenges around security, networking and compliance.
Participants will learn the key architectural decisions, the biggest pitfalls (IAM, quotas, costs), and the lessons that will help them implement similar solutions faster, safer and cheaper.
BigQuery, Vertex AI czy Databricks? Nie wybieraj - połącz je! en pl
Firmy wdrażające AI w chmurze często stają przed wyborem narzędzi - BigQuery do analityki, Databricks do przetwarzania danych i MLOps, Vertex AI do trenowania i serwowania modeli. Każde z nich ma swoje mocne strony, ale brak spójnej integracji prowadzi do silosów, rosnących kosztów i problemów z governance.
W prezentacji opowiem historię projektu budowy kompletnej platformy AI w Google Cloud dla dużej instytucji finansowej, łącząc BigQuery, Databricks i Vertex AI w jeden ekosystem. Pokażę architekturę referencyjną, procesy integracji z CI/CD i prywatnymi repozytoriami Git, implementację IaC w Terraform, a także sposób, w jaki rozwiązaliśmy wyzwania związane z bezpieczeństwem, siecią i compliance.
Uczestnicy poznają konkretne decyzje architektoniczne, największe pułapki (IAM, limity, koszty) oraz wnioski, które pozwolą im wdrożyć podobne rozwiązania szybciej, bezpieczniej i taniej.
Trenuj, wdrażaj, nadzoruj: techniczny przewodnik po AI w Databricks pl
Warsztat przeprowadzi uczestników przez cały cykl życia modeli uczenia maszynowego - od budowy danych, przez trening i automatyzację, aż po wykorzystanie potencjału AI w rozwiązaniach produkcyjnych. Uczestnicy poznają pełny stack MLOps oparty na środowisku Databricks oraz MLFlow, nauczą się projektować pipeline’y, przygotowywać dane, tworzyć cechy, trenować modele, wdrażać je i monitorować w realnym środowisku.
Warsztat stawia na konkret: praktyczne podejście do architektury ML, feature engineeringu, klasycznych algorytmów, sieci neuronowych i głębokich, CI/CD dla modeli, MLOps i nowoczesnych rozwiązań z obszaru AI. Uczestnicy wyjdą z niego z kompletnym obrazem, jak projektować i utrzymywać systemy ML, które działają, skalują się i nie wybuchają w produkcji.
Zakres warsztatu:
1. Architektura AI/ML - pełny obraz stacku ML, role w procesie i referencyjne architektury chmurowe.
2. Dane - praktyczne przygotowanie, czyszczenie, walidacja i budowanie pipeline’ów.
3. Feature engineering - typy cech, transformacje, feature store, monitoring i drift.
4. Algorytmy ML - przegląd najważniejszych metod i ich zastosowanie w praktyce.
5. Trenowanie modeli - metryki, tuning, podejście distributed, MLflow w akcji.
6. Sieci neuronowe i Deep Learning - podstawy sieci, frameworki, skalowanie, GPU/TPU.
7. Pipeline ML - automatyzacja, CI/CD, orkiestracja i wersjonowanie modeli.
8. MLOps - pełne utrzymanie modeli, monitorowanie, testy, rejestry modeli.
Warsztat jest kierowany do inżynierów, data scientistów i architektów pracujących lub planujących zacząć pracę z ML.
Wymagania:
- Laptop z przeglądarką internetową
- Darmowe konto Databricks Free
Efficient data streaming solutions at Scale with Azure en pl
As the volume of streaming data continues to grow, having an efficient, scalable solution for processing and analyzing it in real time is becoming increasingly important. Azure offers a powerful suite of tools for managing large amounts of streaming data.
In this session, we’ll focus on deploying scalable streaming solutions using Event Hubs and Azure Data Explorer (ADX). We’ll cover: integration of Event Hubs as a data source with ADX, using Bicep to automate the deployment of streaming environments, designing scalable streaming solutions that can adapt to growing data demands and best practices and lessons learned for managing and scaling data streaming environments.
This session will provide you with practical insights on how to build and automate data streaming solutions on Azure, ensuring efficient deployment and scalability.
Wydajne strumieniowanie danych w skali w chmurze Azure en pl
Wraz z ciągłym wzrostem wolumenu danych strumieniowych, posiadanie wydajnego, skalowalnego rozwiązania do ich przetwarzania i analizowania w czasie rzeczywistym staje się coraz ważniejsze. Azure oferuje potężny zestaw narzędzi do zarządzania dużymi ilościami danych strumieniowych.
Podczas tej sesji skupimy się na wdrażaniu skalowalnych rozwiązań strumieniowych przy użyciu usług Event Hubs oraz Azure Data Explorer (ADX). Omówimy: integrację Event Hubs jako źródła danych z ADX, wykorzystanie Bicep do automatyzacji wdrażania środowisk strumieniowych, projektowanie skalowalnych rozwiązań strumieniowych, które potrafią dostosować się do rosnącego zapotrzebowania na dane, a także najlepsze praktyki i wyciągnięte wnioski dotyczące zarządzania i skalowania środowisk strumieniowania danych.
Sesja ta dostarczy Ci praktycznych informacji na temat budowania i automatyzacji rozwiązań do strumieniowania danych na platformie Azure, zapewniając efektywne wdrażanie i skalowalność.
SQLDay 2026 Sessionize Event
SQLDay Lite 2025 Sessionize Event
SQLDay 2025 Sessionize Event
SQLDay Lite 2024 Sessionize Event
Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.
Jump to top