
Maciej Kępa
Data Architect @ Datumo
Data Architect @ Datumo
Kraków, Poland
Actions
Senior Data Engineer and Data Architect at Datumo. He has dedicated his career to the fields of AI/ML, edge devices, and IoT. Professionally focused on designing and implementing solutions primarily based on the Azure cloud. A strong advocate of data-centric AI. Privately, an animal lover, gaming enthusiast, and DIY hobbyist.
Inżynier danych oraz architekt danych w Datumo. Swoją karierę zadedykował obszarom AI/ML, urządzeniom brzegowym oraz IoT. Zawodowo związany z projektowaniem oraz wdrażaniem rozwiązań opartych głównie na chmurze Azure. Zwolennik sztucznej inteligencji zorientowanej na dane (Data-centric AI). Prywatnie miłośnik zwierząt, gier komputerowych oraz majsterkowania.
Area of Expertise
Topics
SQL Server and the Vector Revolution - how LLMs see your data en pl
SQL Server 2025 opens a new chapter: support for vector databases - a key component powering Large Language Models (LLMs) and modern AI solutions. But what exactly are vectors? How does text, an image, or code become a row of numbers? What are embeddings, and why are they so critical for semantic processing?
In this session, I’ll explore:
- how LLMs "understand" data,
- what embeddings are and how to create them,
- how to store and search vector data in SQL Server 2025,
- and why a vector database is more than just a new data type.
This session will be rooted in practical scenarios and live demos - no unnecessary math, just a clear focus on bridging traditional data approaches with cutting-edge AI capabilities. If you want to start building solutions today that are ready for tomorrow, this session is for you.
SQL Server i wektorowa rewolucja, czyli jak LLM widzi Twoje dane en pl
SQL Server 2025 otwiera nowy rozdział - obsługę baz wektorowych, kluczowego elementu napędzającego Duże Modele Językowe (LLM) i nowoczesne rozwiązania AI. Ale czym właściwie są wektory? Jak tekst, obraz czy kod staje się rzędem liczb? Co to są embeddingi i dlaczego są tak istotne w przetwarzaniu semantycznym?
W trakcie tej sesji zaprezentuję:
- jak LLM-y „rozumieją” dane,
- czym są embeddingi i jak można je tworzyć,
- jak przechowywać i przeszukiwać dane wektorowe w SQL Server 2025,
- oraz dlaczego baza wektorowa to coś więcej niż tylko nowy typ danych.
Całość osadzona będzie w praktycznych scenariuszach i demo - bez zbędnej matematyki, za to z naciskiem na zrozumienie tego, jak połączyć klasyczne podejście do danych z nowoczesnymi możliwościami AI. Jeśli chcesz dowiedzieć się, jak już dziś budować rozwiązania gotowe na jutro - ta sesja jest dla Ciebie.
Understand your data landscape with Observability platform en pl
Data is the foundation of modern organizations, yet its growing scale and complexity make it increasingly difficult to manage. What data do we have? Where is it stored? How is it processed - and can it be trusted? These are questions many companies struggle to answer. Without full visibility into the data ecosystem, it's hard to make informed decisions, eliminate errors, or meet regulatory requirements.
The solution in such cases is a Data Observability platform - a tool that provides comprehensive visibility, monitoring, and diagnostics across the entire data landscape. This allows organizations to better understand how their data is used and governed, improving its quality and reliability.
In this session, we’ll share how we designed and implemented a Data Observability platform in Azure for a pharmaceutical client, with the core goal of understanding where data lives, what processes affect it, and who uses it. We’ll discuss the industry-specific challenges, technical complexities, and practical takeaways based on key monitoring pillars. This session will offer inspiration and real-world examples to help any organization gain better control over its data environment.
A Hitchhiker's guide to AI/ML en pl
Artificial intelligence and machine learning have become foundational technologies in the modern IT world. While the abundance of available materials, frameworks, and ready-made solutions suggests it’s never been easier to begin, the reality is often more complex. An overwhelming number of options can make it difficult to choose the right path from the start.
In this debate-style session, we’ll explore various approaches to getting started with AI/ML. We'll discuss key tools and resources that make it easier to take your first steps in the field, and examine how to distinguish between solutions that truly move you forward and those that might mislead or slow your progress.
Through real-world examples, we’ll highlight common mistakes and challenges faced by beginners, and share proven ways to avoid them - so your journey into AI/ML is effective, inspiring, and full of opportunity.
You’ll leave this session with a clear action plan, equipped with the knowledge, tools, and confidence to enter the world of AI/ML in the right direction.
MLOps on Azure - war stories and lessons learned en pl
Nearly 80% of AI/ML projects end in failure. Surprising? In a world where AI is booming and solution blueprints are just a click away, building and deploying a machine learning model should be easy - right?
In reality, getting an AI solution into production and keeping it there is a minefield. That’s where MLOps comes in: a set of principles and practices designed to keep your project alive from proof of concept to scalable deployment. Ignore them, and your AI might never leave the sandbox.
This session dives into what MLOps really looks like in the wild. Through real-world “war stories” from refactoring a Computer Vision system on Azure - deployed on edge devices in pharmaceutical plants - you’ll learn why AI systems fail, how to avoid technical debt, and what practices are essential for operationalizing ML at scale. If you're working with AI on Azure, this session will help you connect theory to production reality.
MLOps on Azure - war stories and lessons learned en pl
Około 80% projektów z dziedziny AI/ML kończy się porażką. Statystyka ta może wydawać się zaskakująca - AI jest teraz tak popularne, blueprinty gotowych rozwiązań tak łatwo dostępne, jak trudne może być zbudowanie modelu uczenia maszynowego i wystawienie go na produkcję?
MLOps jest zestawem zasad i najlepszych praktyk mającym zapewnić powodzenie projektu AI w całym cyklu jego życia. Niezrozumienie lub niewłaściwe zastosowanie tych praktyk może sprawić, że również i nasze wdrożenie prędzej czy później utknie w martwym punkcie bez odwrotu.
W trakcie tej sesji omówię czym jest MLOps, na jakich filarach stoi i jak na tych filarach z powodzeniem opierać wdrażane rozwiązanie. Przedstawię również przykłady "z życia wzięte" jak odejście od fundamentów rzutuje na jakość całego systemu. Całość w formie historii wojennych z projektu refaktoryzacji systemu Computer Vision opartego o serwisy chmurowe Azure wdrożonego na urządzeniach brzegowych dwóch zakładów farmaceutycznych.
AI/ML na początek - Twoja mapa startowa w świecie sztucznej inteligencji en pl
Sztuczna inteligencja i uczenie maszynowe to technologie, które stały się fundamentem nowoczesnego świata IT. Choć mnogość dostępnych materiałów, frameworków i gotowych rozwiązań sugeruje, że nigdy nie było łatwiej zacząć, rzeczywistość często okazuje się bardziej skomplikowana. Przytłaczająca liczba opcji potrafi utrudnić wybór odpowiedniego kierunku na starcie.
Podczas tej sesji, w formule debaty, przyjrzymy się różnym podejściom do rozpoczęcia pracy z AI/ML. Omówimy kluczowe narzędzia i zasoby, które ułatwią postawienie pierwszych kroków w tej dziedzinie. Zastanowimy się, jak odróżnić rozwiązania prowadzące do celu od tych, które mogą zmylić i spowolnić rozwój.
Na konkretnych, życiowych przykładach pokażemy najczęstsze błędy i wyzwania, z jakimi mierzą się początkujący. Podzielimy się sprawdzonymi sposobami ich unikania, aby start w AI/ML był skuteczny, inspirujący i pełen nowych możliwości.
Wyjdziesz z tej sesji z jasnym planem działania, gotowy świadomie wkroczyć w świat AI/ML – z wiedzą, narzędziami i pewnością, że obrałeś właściwy kierunek.
Understand your data landscape with Observability platform en pl
Dane to fundament nowoczesnych organizacji, ale ich rosnąca skala i złożoność sprawiają, że zarządzanie nimi staje się coraz trudniejsze. Jakie dane posiadamy, gdzie są przechowywane, jak są przetwarzane i czy można im zaufać – to pytania, na które wiele firm nie potrafi jednoznacznie odpowiedzieć. Bez pełnego wglądu w ekosystem danych trudno jest podejmować świadome decyzje, eliminować błędy czy spełniać regulacyjne wymagania.
W takich sytuacjach rozwiązaniem jest platforma Data Observability – narzędzie zapewniające pełną widoczność, monitorowanie i diagnozowanie problemów w całym krajobrazie danych. Dzięki temu organizacje mogą lepiej zrozumieć, jak ich dane są wykorzystywane i zarządzane, oraz zwiększyć ich jakość i niezawodność.
W tej sesji omówimy, jak zaprojektowaliśmy i wdrożyliśmy platformę Data Observability na chmurze Azure dla klienta z branży farmaceutycznej, gdzie kluczowym celem było zrozumienie, gdzie znajdują się dane, jakie procesy na nie wpływają i kto z nich korzysta. Opowiemy o wyzwaniach technologicznych, specyfice branży oraz praktycznych wskazówkach związanych z budową rozwiązania opartego na konkretnych filarach monitoringu. Sesja dostarczy inspiracji i konkretnych przykładów zastosowania, które mogą być pomocne w lepszym zarządzaniu danymi w każdej organizacji.
Keep it down back there! Jobs are working! – orchestration in Databricks without the drama en pl
Databricks is not just notebooks and Spark SQL - it’s also a powerful platform for automating and orchestrating data processing workflows. During this session, we’ll show how to tame jobs, tasks, and triggers so they run when they should - and do what they’re supposed to – without anyone having to wake up at 3:00 a.m.
Using real examples, we’ll walk through how to design workflows that not only work but are also maintainable and scalable - from simple DAGs to more complex task dependencies. We’ll also compare several job triggering methods: manual, scheduled, event-based, and webhook-based. Expect some coverage of retry logic, inter-job dependencies (not just within a single workflow), notifications, and common pitfalls (“why didn’t this run?!”).
And to top it off - best practices, lessons learned from production deployments, and a bit of dark humor from the life of a data engineer.
After this session, you’ll:
- know which orchestration mechanisms in Databricks actually work in the real world (and which only look good on slides),
- understand how to build automation without fearing late-night pings from your monitor,
- and - perhaps most importantly - regain control over whatever is quietly running “somewhere in the background.”
Cicho tam w tle! Joby pracują! - czyli o orkiestracji w Databricks bez dramatu en pl
Databricks to nie tylko notatniki i Spark SQL - to także potężna platforma do automatyzacji i orkiestracji procesów przetwarzania danych. W trakcie tej sesji zaprezentujemy jak ujarzmić joby, taski i triggery, żeby działały wtedy, kiedy trzeba - i robiły to, co trzeba bez konieczności wstawania o 3:00 w nocy.
Na przykładach pokazane zostaną metody projektowania workflow'ów, które nie tylko działają, ale też dają się utrzymać i skalować - od prostych DAG-ów po bardziej złożone zależności między zadaniami. Porównamy też kilka metod wyzwalania jobów: ręczne, cykliczne, event-based i webhookowe. Będzie też trochę o retry logic, zależnościach między jobami (nie tylko wewnątrz jednego workflowu), notyfikacjach i typowych pułapkach („czemu to się nie odpaliło?!”).
Na deser - dobre praktyki, lessons learned z produkcyjnych wdrożeń i odrobina czarnego humoru z życia data engineera.
Po tej sesji:
- będziesz wiedzieć, które mechanizmy orkiestracji w Databricks naprawdę działają w boju (a które tylko na slajdach),
- zrozumiesz, jak zbudować automatyzację bez strachu przed nocnym pingiem z monitora,
- oraz - być może najważniejsze - odzyskasz kontrolę nad tym, co w Twoim środowisku działa „gdzieś w tle”.
Databricks Overwatch – The Dashboard that sees everything en pl
Effective management of a Databricks environment requires continuous monitoring and analysis of key operational metrics. If you’ve ever wondered how to achieve this, we have the solution - Databricks Overwatch. Overwatch is an open-source tool that provides full visibility into what’s happening within your Databricks environment.
During this session:
- You will learn the theory behind Overwatch – what it exactly is, which real problems it solves, and why it’s worth implementing.
- Step by step, you will configure your own Overwatch job - you’ll see how easy it is to start collecting key data, from installation through integration with the Databricks platform.
- You will discover the power of dashboards and visualizations – you’ll explore example dashboards that help you quickly identify issues, optimize costs, and boost cluster performance.
- Lessons learned from production - you’ll receive valuable tips and insights gained from deploying Overwatch in large-scale production environments.
By the end of the session, you’ll be ready to independently implement and fully leverage the potential of Databricks Overwatch in your environment.
Databricks Overwatch - Dashboard, który widzi wszystko en pl
Efektywne zarządzanie środowiskiem Databricks wymaga ciągłego monitoringu i analizy kluczowych metryk operacyjnych. Jeżeli zastanawiałeś się kiedyś, jak to zrobić to mamy rozwiązanie - Databricks Overwatch. Overwatch to narzędzie open-source, które zapewnia pełną widoczność tego, co dzieje się w Twoim środowisku Databricks.
W trakcie tej sesji:
- Poznasz tajniki teorii Overwatch - dowiesz się, czym dokładnie jest, jakie realne problemy rozwiązuje oraz dlaczego warto go wdrożyć.
- Krok po kroku skonfigurujesz swój własny job Overwatch - zobaczysz, jak łatwo uruchomić zbieranie kluczowych danych, od instalacji aż po integrację z platformą Databricks.
- Odkryjesz moc dashboardów i wizualizacji - poznasz przykładowe dashboardy, dzięki którym szybko zidentyfikujesz problemy, zoptymalizujesz koszty oraz zwiększysz wydajność klastrów.
- Lessons learned z produkcji - otrzymasz cenne wskazówki i doświadczenia zdobyte podczas wdrożeń Overwatch w dużych środowiskach produkcyjnych.
Po zakończeniu sesji będziesz gotowy, by samodzielnie wdrożyć oraz maksymalnie wykorzystać potencjał Databricks Overwatch w swoim środowisku.
SQLDay Lite 2025 Sessionize Event Upcoming
AIBA Conference 2025 Upcoming
SQLDay 2025 Sessionize Event
SQLDay Lite 2024 Sessionize Event
Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.
Jump to top