Speaker

Maciej Kępa

Data Architect @ Datumo

Kraków, Poland

Actions

Senior Data Engineer and Data Architect at Datumo. He has dedicated his career to the fields of AI/ML, edge devices, and IoT. Professionally focused on designing and implementing solutions primarily based on the Azure cloud. A strong advocate of data-centric AI. Privately, an animal lover, gaming enthusiast, and DIY hobbyist.

Senior Data Engineer oraz Data Architect w Datumo, który od lat rozwija swoją karierę w obszarach AI/ML, urządzeń brzegowych (Edge) oraz IoT. Specjalizuje się w projektowaniu i wdrażaniu zaawansowanych rozwiązań opartych głównie na chmurze Azure. Jest gorącym zwolennikiem podejścia Data-centric AI, stawiającego jakość danych w centrum procesów budowania modeli. Prywatnie miłośnik zwierząt, fan gamingu i pasjonat majsterkowania (DIY).

Area of Expertise

Information & Communications Technology

Topics

MLOps
Microsoft Azure
Data & AI
Artificial Inteligence
Machine Learning
Data Platform
Databricks
Azure

Sessions

SQL Server and the Vector Revolution - how LLMs see your data en pl

SQL Server 2025 opens a new chapter: support for vector databases - a key component powering Large Language Models (LLMs) and modern AI solutions. But what exactly are vectors? How does text, an image, or code become a row of numbers? What are embeddings, and why are they so critical for semantic processing?

In this session, I’ll explore:
- how LLMs "understand" data,
- what embeddings are and how to create them,
- how to store and search vector data in SQL Server 2025,
- and why a vector database is more than just a new data type.

This session will be rooted in practical scenarios and live demos - no unnecessary math, just a clear focus on bridging traditional data approaches with cutting-edge AI capabilities. If you want to start building solutions today that are ready for tomorrow, this session is for you.

SQL Server i wektorowa rewolucja, czyli jak LLM widzi Twoje dane en pl

SQL Server 2025 otwiera nowy rozdział - obsługę baz wektorowych, kluczowego elementu napędzającego Duże Modele Językowe (LLM) i nowoczesne rozwiązania AI. Ale czym właściwie są wektory? Jak tekst, obraz czy kod staje się rzędem liczb? Co to są embeddingi i dlaczego są tak istotne w przetwarzaniu semantycznym?

W trakcie tej sesji zaprezentuję:
- jak LLM-y „rozumieją” dane,
- czym są embeddingi i jak można je tworzyć,
- jak przechowywać i przeszukiwać dane wektorowe w SQL Server 2025,
- oraz dlaczego baza wektorowa to coś więcej niż tylko nowy typ danych.

Całość osadzona będzie w praktycznych scenariuszach i demo - bez zbędnej matematyki, za to z naciskiem na zrozumienie tego, jak połączyć klasyczne podejście do danych z nowoczesnymi możliwościami AI. Jeśli chcesz dowiedzieć się, jak już dziś budować rozwiązania gotowe na jutro - ta sesja jest dla Ciebie.

Understand your data landscape with Observability platform en pl

Data is the foundation of modern organizations, yet its growing scale and complexity make it increasingly difficult to manage. What data do we have? Where is it stored? How is it processed - and can it be trusted? These are questions many companies struggle to answer. Without full visibility into the data ecosystem, it's hard to make informed decisions, eliminate errors, or meet regulatory requirements.

The solution in such cases is a Data Observability platform - a tool that provides comprehensive visibility, monitoring, and diagnostics across the entire data landscape. This allows organizations to better understand how their data is used and governed, improving its quality and reliability.

In this session, we’ll share how we designed and implemented a Data Observability platform in Azure for a pharmaceutical client, with the core goal of understanding where data lives, what processes affect it, and who uses it. We’ll discuss the industry-specific challenges, technical complexities, and practical takeaways based on key monitoring pillars. This session will offer inspiration and real-world examples to help any organization gain better control over its data environment.

A Hitchhiker's guide to AI/ML en pl

Artificial intelligence and machine learning have become foundational technologies in the modern IT world. While the abundance of available materials, frameworks, and ready-made solutions suggests it’s never been easier to begin, the reality is often more complex. An overwhelming number of options can make it difficult to choose the right path from the start.

In this debate-style session, we’ll explore various approaches to getting started with AI/ML. We'll discuss key tools and resources that make it easier to take your first steps in the field, and examine how to distinguish between solutions that truly move you forward and those that might mislead or slow your progress.

Through real-world examples, we’ll highlight common mistakes and challenges faced by beginners, and share proven ways to avoid them - so your journey into AI/ML is effective, inspiring, and full of opportunity.

You’ll leave this session with a clear action plan, equipped with the knowledge, tools, and confidence to enter the world of AI/ML in the right direction.

MLOps on Azure - war stories and lessons learned en pl

Nearly 80% of AI/ML projects end in failure. Surprising? In a world where AI is booming and solution blueprints are just a click away, building and deploying a machine learning model should be easy - right?

In reality, getting an AI solution into production and keeping it there is a minefield. That’s where MLOps comes in: a set of principles and practices designed to keep your project alive from proof of concept to scalable deployment. Ignore them, and your AI might never leave the sandbox.

This session dives into what MLOps really looks like in the wild. Through real-world “war stories” from refactoring a Computer Vision system on Azure - deployed on edge devices in pharmaceutical plants - you’ll learn why AI systems fail, how to avoid technical debt, and what practices are essential for operationalizing ML at scale. If you're working with AI on Azure, this session will help you connect theory to production reality.

MLOps on Azure - war stories and lessons learned en pl

Około 80% projektów z dziedziny AI/ML kończy się porażką. Statystyka ta może wydawać się zaskakująca - AI jest teraz tak popularne, blueprinty gotowych rozwiązań tak łatwo dostępne, jak trudne może być zbudowanie modelu uczenia maszynowego i wystawienie go na produkcję?

MLOps jest zestawem zasad i najlepszych praktyk mającym zapewnić powodzenie projektu AI w całym cyklu jego życia. Niezrozumienie lub niewłaściwe zastosowanie tych praktyk może sprawić, że również i nasze wdrożenie prędzej czy później utknie w martwym punkcie bez odwrotu.

W trakcie tej sesji omówię czym jest MLOps, na jakich filarach stoi i jak na tych filarach z powodzeniem opierać wdrażane rozwiązanie. Przedstawię również przykłady "z życia wzięte" jak odejście od fundamentów rzutuje na jakość całego systemu. Całość w formie historii wojennych z projektu refaktoryzacji systemu Computer Vision opartego o serwisy chmurowe Azure wdrożonego na urządzeniach brzegowych dwóch zakładów farmaceutycznych.

AI/ML na początek - Twoja mapa startowa w świecie sztucznej inteligencji en pl

Sztuczna inteligencja i uczenie maszynowe to technologie, które stały się fundamentem nowoczesnego świata IT. Choć mnogość dostępnych materiałów, frameworków i gotowych rozwiązań sugeruje, że nigdy nie było łatwiej zacząć, rzeczywistość często okazuje się bardziej skomplikowana. Przytłaczająca liczba opcji potrafi utrudnić wybór odpowiedniego kierunku na starcie.

Podczas tej sesji, w formule debaty, przyjrzymy się różnym podejściom do rozpoczęcia pracy z AI/ML. Omówimy kluczowe narzędzia i zasoby, które ułatwią postawienie pierwszych kroków w tej dziedzinie. Zastanowimy się, jak odróżnić rozwiązania prowadzące do celu od tych, które mogą zmylić i spowolnić rozwój.

Na konkretnych, życiowych przykładach pokażemy najczęstsze błędy i wyzwania, z jakimi mierzą się początkujący. Podzielimy się sprawdzonymi sposobami ich unikania, aby start w AI/ML był skuteczny, inspirujący i pełen nowych możliwości.

Wyjdziesz z tej sesji z jasnym planem działania, gotowy świadomie wkroczyć w świat AI/ML – z wiedzą, narzędziami i pewnością, że obrałeś właściwy kierunek.

Understand your data landscape with Observability platform en pl

Dane to fundament nowoczesnych organizacji, ale ich rosnąca skala i złożoność sprawiają, że zarządzanie nimi staje się coraz trudniejsze. Jakie dane posiadamy, gdzie są przechowywane, jak są przetwarzane i czy można im zaufać – to pytania, na które wiele firm nie potrafi jednoznacznie odpowiedzieć. Bez pełnego wglądu w ekosystem danych trudno jest podejmować świadome decyzje, eliminować błędy czy spełniać regulacyjne wymagania.

W takich sytuacjach rozwiązaniem jest platforma Data Observability – narzędzie zapewniające pełną widoczność, monitorowanie i diagnozowanie problemów w całym krajobrazie danych. Dzięki temu organizacje mogą lepiej zrozumieć, jak ich dane są wykorzystywane i zarządzane, oraz zwiększyć ich jakość i niezawodność.

W tej sesji omówimy, jak zaprojektowaliśmy i wdrożyliśmy platformę Data Observability na chmurze Azure dla klienta z branży farmaceutycznej, gdzie kluczowym celem było zrozumienie, gdzie znajdują się dane, jakie procesy na nie wpływają i kto z nich korzysta. Opowiemy o wyzwaniach technologicznych, specyfice branży oraz praktycznych wskazówkach związanych z budową rozwiązania opartego na konkretnych filarach monitoringu. Sesja dostarczy inspiracji i konkretnych przykładów zastosowania, które mogą być pomocne w lepszym zarządzaniu danymi w każdej organizacji.

Keep it down back there! Jobs are working! – orchestration in Databricks without the drama en pl

Databricks is not just notebooks and Spark SQL - it’s also a powerful platform for automating and orchestrating data processing workflows. During this session, we’ll show how to tame jobs, tasks, and triggers so they run when they should - and do what they’re supposed to – without anyone having to wake up at 3:00 a.m.

Using real examples, we’ll walk through how to design workflows that not only work but are also maintainable and scalable - from simple DAGs to more complex task dependencies. We’ll also compare several job triggering methods: manual, scheduled, event-based, and webhook-based. Expect some coverage of retry logic, inter-job dependencies (not just within a single workflow), notifications, and common pitfalls (“why didn’t this run?!”).

And to top it off - best practices, lessons learned from production deployments, and a bit of dark humor from the life of a data engineer.

After this session, you’ll:
- know which orchestration mechanisms in Databricks actually work in the real world (and which only look good on slides),
- understand how to build automation without fearing late-night pings from your monitor,
- and - perhaps most importantly - regain control over whatever is quietly running “somewhere in the background.”

Cicho tam w tle! Joby pracują! - czyli o orkiestracji w Databricks bez dramatu en pl

Databricks to nie tylko notatniki i Spark SQL - to także potężna platforma do automatyzacji i orkiestracji procesów przetwarzania danych. W trakcie tej sesji zaprezentujemy jak ujarzmić joby, taski i triggery, żeby działały wtedy, kiedy trzeba - i robiły to, co trzeba bez konieczności wstawania o 3:00 w nocy.

Na przykładach pokazane zostaną metody projektowania workflow'ów, które nie tylko działają, ale też dają się utrzymać i skalować - od prostych DAG-ów po bardziej złożone zależności między zadaniami. Porównamy też kilka metod wyzwalania jobów: ręczne, cykliczne, event-based i webhookowe. Będzie też trochę o retry logic, zależnościach między jobami (nie tylko wewnątrz jednego workflowu), notyfikacjach i typowych pułapkach („czemu to się nie odpaliło?!”).

Na deser - dobre praktyki, lessons learned z produkcyjnych wdrożeń i odrobina czarnego humoru z życia data engineera.

Po tej sesji:
- będziesz wiedzieć, które mechanizmy orkiestracji w Databricks naprawdę działają w boju (a które tylko na slajdach),
- zrozumiesz, jak zbudować automatyzację bez strachu przed nocnym pingiem z monitora,
- oraz - być może najważniejsze - odzyskasz kontrolę nad tym, co w Twoim środowisku działa „gdzieś w tle”.

Databricks Overwatch – The Dashboard that sees everything en pl

Effective management of a Databricks environment requires continuous monitoring and analysis of key operational metrics. If you’ve ever wondered how to achieve this, we have the solution - Databricks Overwatch. Overwatch is an open-source tool that provides full visibility into what’s happening within your Databricks environment.

During this session:
- You will learn the theory behind Overwatch – what it exactly is, which real problems it solves, and why it’s worth implementing.
- Step by step, you will configure your own Overwatch job - you’ll see how easy it is to start collecting key data, from installation through integration with the Databricks platform.
- You will discover the power of dashboards and visualizations – you’ll explore example dashboards that help you quickly identify issues, optimize costs, and boost cluster performance.
- Lessons learned from production - you’ll receive valuable tips and insights gained from deploying Overwatch in large-scale production environments.

By the end of the session, you’ll be ready to independently implement and fully leverage the potential of Databricks Overwatch in your environment.

Databricks Overwatch - Dashboard, który widzi wszystko en pl

Efektywne zarządzanie środowiskiem Databricks wymaga ciągłego monitoringu i analizy kluczowych metryk operacyjnych. Jeżeli zastanawiałeś się kiedyś, jak to zrobić to mamy rozwiązanie - Databricks Overwatch. Overwatch to narzędzie open-source, które zapewnia pełną widoczność tego, co dzieje się w Twoim środowisku Databricks.

W trakcie tej sesji:
- Poznasz tajniki teorii Overwatch - dowiesz się, czym dokładnie jest, jakie realne problemy rozwiązuje oraz dlaczego warto go wdrożyć.
- Krok po kroku skonfigurujesz swój własny job Overwatch - zobaczysz, jak łatwo uruchomić zbieranie kluczowych danych, od instalacji aż po integrację z platformą Databricks.
- Odkryjesz moc dashboardów i wizualizacji - poznasz przykładowe dashboardy, dzięki którym szybko zidentyfikujesz problemy, zoptymalizujesz koszty oraz zwiększysz wydajność klastrów.
- Lessons learned z produkcji - otrzymasz cenne wskazówki i doświadczenia zdobyte podczas wdrożeń Overwatch w dużych środowiskach produkcyjnych.

Po zakończeniu sesji będziesz gotowy, by samodzielnie wdrożyć oraz maksymalnie wykorzystać potencjał Databricks Overwatch w swoim środowisku.

BigQuery, Vertex AI or Databricks? Don’t choose - combine them! en pl

Companies adopting AI in the cloud often face a tool-selection dilemma: BigQuery for analytics, Databricks for data processing and MLOps, Vertex AI for training and serving models. Each has its strengths, but without cohesive integration you end up with silos, rising costs and governance headaches.

In this presentation, I’ll walk through a project where we built a complete AI platform in Google Cloud for a major financial institution, bringing BigQuery, Databricks and Vertex AI together into a single ecosystem. I’ll show the reference architecture, integration with CI/CD and private Git repositories, Terraform-based IaC, and how we tackled challenges around security, networking and compliance.

Participants will learn the key architectural decisions, the biggest pitfalls (IAM, quotas, costs), and the lessons that will help them implement similar solutions faster, safer and cheaper.

BigQuery, Vertex AI czy Databricks? Nie wybieraj - połącz je! en pl

Firmy wdrażające AI w chmurze często stają przed wyborem narzędzi - BigQuery do analityki, Databricks do przetwarzania danych i MLOps, Vertex AI do trenowania i serwowania modeli. Każde z nich ma swoje mocne strony, ale brak spójnej integracji prowadzi do silosów, rosnących kosztów i problemów z governance.

W prezentacji opowiem historię projektu budowy kompletnej platformy AI w Google Cloud dla dużej instytucji finansowej, łącząc BigQuery, Databricks i Vertex AI w jeden ekosystem. Pokażę architekturę referencyjną, procesy integracji z CI/CD i prywatnymi repozytoriami Git, implementację IaC w Terraform, a także sposób, w jaki rozwiązaliśmy wyzwania związane z bezpieczeństwem, siecią i compliance.

Uczestnicy poznają konkretne decyzje architektoniczne, największe pułapki (IAM, limity, koszty) oraz wnioski, które pozwolą im wdrożyć podobne rozwiązania szybciej, bezpieczniej i taniej.

Trenuj, wdrażaj, nadzoruj: techniczny przewodnik po AI w Databricks pl

Warsztat przeprowadzi uczestników przez cały cykl życia modeli uczenia maszynowego - od budowy danych, przez trening i automatyzację, aż po wykorzystanie potencjału AI w rozwiązaniach produkcyjnych. Uczestnicy poznają pełny stack MLOps oparty na środowisku Databricks oraz MLFlow, nauczą się projektować pipeline’y, przygotowywać dane, tworzyć cechy, trenować modele, wdrażać je i monitorować w realnym środowisku.

Warsztat stawia na konkret: praktyczne podejście do architektury ML, feature engineeringu, klasycznych algorytmów, sieci neuronowych i głębokich, CI/CD dla modeli, MLOps i nowoczesnych rozwiązań z obszaru AI. Uczestnicy wyjdą z niego z kompletnym obrazem, jak projektować i utrzymywać systemy ML, które działają, skalują się i nie wybuchają w produkcji.

Zakres warsztatu:
1. Architektura AI/ML - pełny obraz stacku ML, role w procesie i referencyjne architektury chmurowe.
2. Dane - praktyczne przygotowanie, czyszczenie, walidacja i budowanie pipeline’ów.
3. Feature engineering - typy cech, transformacje, feature store, monitoring i drift.
4. Algorytmy ML - przegląd najważniejszych metod i ich zastosowanie w praktyce.
5. Trenowanie modeli - metryki, tuning, podejście distributed, MLflow w akcji.
6. Sieci neuronowe i Deep Learning - podstawy sieci, frameworki, skalowanie, GPU/TPU.
7. Pipeline ML - automatyzacja, CI/CD, orkiestracja i wersjonowanie modeli.
8. MLOps - pełne utrzymanie modeli, monitorowanie, testy, rejestry modeli.

Warsztat jest kierowany do inżynierów, data scientistów i architektów pracujących lub planujących zacząć pracę z ML.

Wymagania:
- Laptop z przeglądarką internetową
- Darmowe konto Databricks Free

SQLDay 2026 Sessionize Event Upcoming

May 2026 Wrocław, Poland

SQLDay Lite 2025 Sessionize Event

October 2025 Bielsko-Biala, Poland

SQLDay 2025 Sessionize Event

May 2025 Wrocław, Poland

Data Science Summit 2024

November 2024 Warsaw, Poland

SQLDay Lite 2024 Sessionize Event

October 2024 Bydgoszcz, Poland

Maciej Kępa

Data Architect @ Datumo

Kraków, Poland

Actions

Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.

Speaker

Maciej Kępa

Actions

Links

Area of Expertise

Topics

Sessions

SQL Server and the Vector Revolution - how LLMs see your data en pl

SQL Server i wektorowa rewolucja, czyli jak LLM widzi Twoje dane en pl

Understand your data landscape with Observability platform en pl

A Hitchhiker's guide to AI/ML en pl

MLOps on Azure - war stories and lessons learned en pl

MLOps on Azure - war stories and lessons learned en pl

AI/ML na początek - Twoja mapa startowa w świecie sztucznej inteligencji en pl

Understand your data landscape with Observability platform en pl

Keep it down back there! Jobs are working! – orchestration in Databricks without the drama en pl

Cicho tam w tle! Joby pracują! - czyli o orkiestracji w Databricks bez dramatu en pl

Databricks Overwatch – The Dashboard that sees everything en pl

Databricks Overwatch - Dashboard, który widzi wszystko en pl

BigQuery, Vertex AI or Databricks? Don’t choose - combine them! en pl

BigQuery, Vertex AI czy Databricks? Nie wybieraj - połącz je! en pl

Trenuj, wdrażaj, nadzoruj: techniczny przewodnik po AI w Databricks pl

Events

SQLDay 2026 Sessionize Event Upcoming

SQL Server 2025 Launch

Infoshare Katowice 2025

Data Science Summit 2025

SQLDay Lite 2025 Sessionize Event

AIBA Conference 2025

MS Tech Summit 2025

Data Science Summit AI/ML Edition 2025

SQLDay 2025 Sessionize Event

Data Science Summit 2024

SQLDay Lite 2024 Sessionize Event

Maciej Kępa

Links

Actions