Speaker

Thomas Hütter

Thomas Hütter

Explorer of Data

Explorer of Data

Brüggen, Germany

Thomas holds a degree in Business Economics, but has been a data explorer and a developer at heart ever since the days of dBase and Turbo Pascal. He touched his first SQL Server at V6.5 and used covering indexes before they became a feature.

Thomas has been developing in Navision/Dynamics/Business Central systems for quite some time (since 2001, one year before MS acquired Navision), joined PASS in 2006, got his hands on R in 2014 (the year before MS bought Revolution Analytics) and on the Power Platform from 2020 on. He has worked for ISVs as well as end-user companies, as a developer, consultant, accidental DBA and is an author for data-related articles as well as a speaker at data events across Europe.

Thomas hat einen Abschluss als Diplom-Betriebswirt, ist aber seit den Tagen von dBase und Turbo-Pascal Datentüftler und Entwickler mit Leib und Seele. Er kam mit dem SQL Server zum ersten Mal mit V6.5 in Berührung und hat Covering Indizes eingesetzt, schon bevor sie zum Feature wurden.

Thomas entwickelt schon ziemlich lange in Navision/Dynamics/Business Central-Umgebungen (seit 2001, ein Jahr bevor Microsoft Navision übernahm), ist PASS Mitglied seit 2006, und beschäftigt sich mit R seit 2014 (dem Jahr bevor Microsoft Revolution Analytics kaufte) und mit der Power Platform seit 2020. Er hat für Systemhäuser und bei Endanwendern gearbeitet als Entwickler, Berater, Zufalls-DBA, ist Autor daten(bank)bezogener Artikel, aber auch als Sprecher auf Data-Events in Europa unterwegs.

Area of Expertise

  • Information & Communications Technology
  • Media & Information

Topics

  • SQL
  • R
  • Analytics and Big Data
  • Databases
  • Data Analysis
  • Data Science
  • Data Visualization
  • Microsoft Data Platform
  • Microsoft Power platform
  • Process Mining
  • Power Apps
  • Power Automate
  • Power BI
  • Azure Data Studio
  • RStudio

Sessions

Running SQL Server on a Chromebook? Yes, you can! en de

Quick introduction to todays ChromeOS (not everything is purely online any more) and Chromebooks standard, plus and premium classes.
Demo of how to install Debian Linux, SQL Server and Azure Data Studio and get the combo working on this minimalistic hardware.

Lightning talk/5 mins

SQL Server auf'm Chromebook? Ja, das geht! en de

Kurze Einführung in das heutige ChromeOS (es ist nicht mehr alles nur online) und die Chromebook-Klassen Standard, Plus und Premium.
Demo, wie man Debian Linux installiert, dann SQL Server und Azure Data Studio, und diese Combo auf minimalistischer Hardware ans Laufen bringt.

Lightning talk/5 mins

A SQL primer for the casual DB developer en de

Every developer needs to handle data every now and then, from simple CSV and JSON files to data stored in a relational database system which usually understands the 'Structured Query Language', for short SQL. This session offers an intro to the most basic/most important SQL commands.

For starters, we'll make sense out of some more three letter acronyms, like DDL, DML, DQL etc. From creating and dropping database objects to ingesting, manipulating and retrieving data, you'll learn when to use which commands and options. We will not spare out Joins and aggregate functions, so you can really make sense of it all.

For the demos we will use the Microsoft SQL Server, which offers freely available editions (Express and Developer) so you can practice without incurring costs.

90 mins

Eine SQL-Einführung für den gelegentlichen DB-Entwickler en de

Jeder Entwickler muss gelegentlich Daten bearbeiten, von einfachen CSV- oder JSON-Dateien bis zu Daten in relationalen Datenbanksystemen, die meistens die 'Structured Query Language' sprechen, kurz SQL. Diese Session bietet eine Einführung in die wesentlichen SQL-Befehle.

Zuerst bringen wir etwas Licht ins Dunkel der 3-Buchstaben-Abkürzungen wie DDL, DML, DQL etc. Wir lernen das Anlegen und Entsorgen von Datenbank-Objekten, wie man Daten einfügt, bearbeitet und abfragt, für jede Aufgabe die richtigen Kommandos und Optionen. Wir lassen auch Joins und Aggregatfunktion nicht aus, um das Gesamtbild zu sehen.

Für die Demos werden wir den Microsoft SQL Server nutzen, von dem es frei erhätliche Versionen (Express und Developer) gibt, so daß Ihr ohne weitere Kosten üben könnt.

An R primer for SQL folks en de

You heard about the “R” language and it’s growing popularity for data analysis. Now you need a walk-through on what is possible analyzing your data? Then this session is for you:

You’ll get a short introduction how R came to be, and what the R ecosystem looks like today. Then we will extract sales data from different companies off a Navision ERP database on SQL Server.
Our data will be cleaned, aggregated and enriched in the RStudio environment. We’ll generate different diagrams on-the-fly to gain first insights.
Finally we’ll see how to use the Shiny framework to display our data on a map, interactively changing our criteria, and showing us where the white spots really are.

An R primer for SQL folks en de

Du hast von dieser neuen Sprache "R" gehört, und ihrer wachsenden Popularität für Datenanalysen? Jetzt brauchst Du einen Überblick, was R in Sachen Analyse möglich macht?

Diese Session ist für Dich:
Es gibt eine kurze Einführung, wie R entstanden ist, und wie das R-Ökosystem heute aussieht. Dann geht es auch schon los: wir extrahieren Verkaufszahlen aus mehreren Mandanten einer Navision ERP Datenbank auf einem SQL Server. Unsere Daten werden in der RStudio-Umgebung gesäubert, aggregiert und ergänzt. Wir generieren verschiedene Diagramme, die uns erste
Einblicke in unsere "Echt"-Daten erlauben. Mit dem Shiny-Framework stellen wir die Daten auf einer Deutschlandkarte dar, ändern hierbei interaktiv unsere Kriterien, und sehen so, wo die weissen Flecken wirklich sind.

50 ways to show your data en de

„A picture is worth a thousand words“ - well, that is especially true when it comes to analyzing data. Visualization is the quick and easy way to uncover the big ‘picture’ in your data and the R ecosystem has a lot to offer in this regard.

They may not add up to exactly 50, but in this session I’ll show you lots of compelling visualizations produced with the help of the ggplot2 package and friends - and their usual small effort of code. We will start beyond the usual bar, line or scatter plots.

Instead our screen will show diagrams that always made you think „How do they do that?“. We will see waterfall diagrams, violins, parliament diagrams, marginal histograms, maps and more… and you’ll get the code to reproduce everything.

50 ways to show your data en de

„Ein Bild sagt mehr als tausend Worte“ - wie wahr, auch und gerade bei der Datenanalyse. Visualisierung ist der schnelle, einfache Weg, das Gesamtbild in Deinen Daten zu erkennen, und gerade das R-Ökosystem hat in dieser Hinsicht einiges zu bieten.

Es mögen nicht genau 50 sein, aber in dieser Session zeige ich viele ansprechende Visualisierungen, die das ggplot2-Package und seine Freunde ermöglichen. Wir starten jenseits der üblichen Balken-, Linien- und Streudiagramme.

Stattdessen kommen Diagramme auf den Bildschirm, von denen Du schon immer wissen wolltest „Wie macht man das?“. Wir werden Wasserfalldiagramme, Violinen, Parlament-Diagramme, Randhistogramme, Karten und mehr sehen… und Ihr bekommt den Code, um alles nachzubauen.

A journey through the Tidyverse en de

By now, all the data pro world should have heard about the R language, especially since Microsoft is committed to integrate it into their data platform products. So you installed the R base system and the IDE of your choice. But it's like buying a new car - nobody is content with the standard. You know there are packages to get you started with analysis and visualisation, but which ones?

A bundle called The Tidyverse comes in handy, consisting of a philosophy of tidy data and some packages mostly (co-)authored by Hadley Wickham, one of the brightest minds in the R ecosystem. We will take a look at the most popular Tidyverse ingredients like tidyr, ggplot2, dplyr and readr, and we'll have lots of code demos on real world examples.

A journey through the Tidyverse en de

Inzwischen dürfte wohl die ganze Datenprofi-Welt von der (Programmier-)Sprache R gehört haben, nicht zuletzt, seit Microsoft sie in immer mehr ihrer Data Platform Produkte integriert. Du hast also Dein R Basis-System installiert, und die Entwicklungsumgebung Deiner Wahl. Aber es ist wie beim Kauf eines neuen Autos – mit der Standardausstattung ist keiner zufrieden. Du weißt, es gibt x Pakete, die Dir bei Analyse und Visualisierung helfen, aber welche nimmst Du?

Hier bietet sich ein Bündel mit dem Namen „The Tidyverse“ an, eine Philosphie „aufgeräumter“ Daten und einiger Pakete, größtenteils (mit-)entwickelt von Hadley Wickham, einem der hellsten Köpfe im R-Ökosystem. Wir werden uns in dieser Session die beliebtesten Zutaten des Tidyverse ansehen, wie tidyr, ggplot2, dplyr und readr, garniert mit vielen Code-Beispielen zum mit- bzw. nachmachen.

A refresher on geospatial data in SQL Server en de

Microsoft introduced geospatial data types already in SQL Server 2008, some enhancements followed in version 2012. Today, geo data is used almost everywhere - it's the foundation to everything position- or route-related. Time to refresh your memories of geometry and geography!

We'll walk through which data types are supported - from 0 to 2 dimensions, from points to polygons and some more - and see how to get spatial data into and out of SQL Server tables.

Then there are built-in functions to determine relationships between geo objects, such as intersection, inclusion or shortest distance. And of course there will be examples of practical applications of geospatial data.

A refresher on geospatial data in SQL Server en de

Microsoft hat die Geo-Datentypen bereits mit dem SQL Server 2008 eingeführt, mit der Version 2012 folgten einige Verbesserungen. Heute werden Geodaten fast überall verwendet - sie sind die Grundlage für alles, was einen Positions- oder Routen-Bezug hat. Es ist also an der Zeit, Eure Erinnerungen an Geometrie und Geographie aufzufrischen!

Wir schauen uns an, welche Datentypen unterstützt werden - von 0 bis 2 Dimensionen, von Punkten bis zu Polygonen und anderen - und werden sehen, wie man Geodaten in die SQL Server Tabellen hinein und wieder heraus bekommt.

Darauf folgen die eingebauten Funktionen, mit denen Beziehungen zwischen Geo-Objekten untersucht werden können, wie Überschneidungen, Einschlüsse oder kürzester Abstand. Und natürlich gibt es Beispiele für die praktische Anwendung von Geodaten.

"Can I join you?", one table asked the other en de

So you have your database beautifully set up according to Codd. What do you need when you have to retrieve data from related tables? Most probably a JOIN operator, but which one?

From LEFT to RIGHT, when is it INNER and when OUTER? Is a CROSS JOIN something NATURAL? And why may ANTI yield more results than SEMI...? How and when do their buddies MERGE, HASH and NESTED LOOP get to participate?

We'll have demos for all of this on well-known databases. And if all that doesn't make your head dizzy enough, I might even throw in some CROSS and OUTER APPLY.

"Can I join you?", one table asked the other en de

Du hast also Deine Datenbank wunderschön nach den Regeln von Codd aufgebaut. Was brauchst Du dann, um Daten aus zusammenhängenden Tabellen abzurufen? Sehr wahrscheinlich einen JOIN Operator, aber welchen?

Von LEFT nach RIGHT, wann ist es INNER und wann OUTER? Ist ein CROSS JOIN auch NATURAL? Und wann gibt ein ANTI mehr Ergebnisse zurück als ein SEMI...? Wie und wann sind ihre Kumpels MERGE, HASH und NESTED LOOP beteiligt?

Für all dies gibt's Demos auf vertrauten Datenbanken. Und wenn Dir von all dem der Schädel noch nicht genug brummt, lege ich noch etwas CROSS und OUTER APPLY oben drauf.

Hunting for fraud with Benford's law in R en de

In this lightning talk I'll demonstrate how to apply the R implementation of Benford's law (which actually is not about crime or fraud) to identify possibly fraudulent invoice or other data.

Auf der Jagd nach Betrug mit Benford's Gesetz in R en de

In dieser Lightning Session zeige ich Euch, wie man Benford's Gesetz (bei dem es eigentlich nicht um Kriminalität oder Betrug geht) in R anwendet, um möglicherweise betrügerische Rechnungs- oder andere Daten zu finden.

Poor folks' SQL Server job monitoring with R en de

Of course SQL Server (Management or Azure Data Studio) offers you a list view of the agent job history. But wouldn't it be nice to have a graphical overview of job durations and how they develop?

This session is for DBAs and R newbies alike: In one hour we'll develop a dashboard-like overview of your agent jobs' and their durations with the R language.

We'll work our way from finding the right system tables to use, generating one graph per job with the help of R, to adding that little trend line to every one of them. After creating it in RStudio, we'll eventually adapt our script to run in SSMS/ADS just as fine. Once finished, no additional tools are needed, no additional €€ spent.

SQL Server Job-Monitoring für Arme - mit R en de

Natürlich bietet SQL Server (Management oder Azure Data Studio) einen Überblick über die Historie der Agent Jobs. Aber wie wäre es mit einer grafischen Darstellung der Job-Laufzeiten und ihrer Entwicklung?

Diese Session ist für DBAs und R-Neulinge: in einer Stunde entwickeln wir mit Hilfe der Sprache R einen Dashboard-Überblick über Deine Agent-Jobs und ihre Laufzeiten.

Wir arbeiten uns voran, vom Finden der richtigen Systemtabellen, generieren eine Grafik pro Job, und fügen jeder von ihnen diese kleine Trendlinie hinzu. Nachdem wir es in RStudio erstellt haben, passen wir unser Script an, so daß es am Ende genau so gut im SSMS/ADS läuft. Und dann gilt: keine zusätzlichen €€ für zusätzliche Tools ausgegeben!

What are SQL statistics and why should the developer care? en de

Imagine you're a developer in a small shop, and you experience some degradation of performance in your business-critical ERP system, literally over the weekend.

So you are tasked with bringing back that performance, because somehow you also inherited the "accidental DBA " role. Hardware is OK, the network is OK, and your application hasn't changed lately, either. Now what?

Let me take you for a quick dive into how your queries get analyzed and optimized by the SQL Server engine. You'll learn about statistics (also about density and cardinality), why they are important, ways to explore them and the techniques to keep them up to date, in order to achieve optimal query plans.

Was sind SQL-Statistiken und warum sollten sie den Entwickler interessieren? en de

Stell Dir vor, Du bist Entwickler in einem kleinen/mittleren Unternehmen, und es gibt Performance-Einbrüche in Eurem geschäftskritischen ERP-System, buchstäblich übers Wochenende.

Deine Aufgabe ist, die Performance zurückzubringen, denn Du hast auch die Rolle des "zufälligen DBA" geerbt. Die Hardware ist OK, das Netzwerk ist OK, es gab keine Änderungen an der Applikation. Also was jetzt?

In dieser Session gewinnen wir zunächst einen Überblick, wie Abfragen durch den SQL Server analysiert und optimiert werden. Du lernst, was Statistiken (und Dichte und Kardinalität) sind, warum sie wichtig sind, wie wir sie untersuchen, und mit welchen Techniken wir sie aktuell halten können, um optimale Abfragepläne zu gewährleistungen.

So, what about JSON in my database? en de

The JSON data format, also called hipster's XML, is all around, not only in Javascript environments. In this session we'll first see where it comes from, what it looks like and what it can be used for.

Next we'll explore how SQL Server handles JSON. Despite not providing a dedicated data type for it, there are some sophisticated functions for storing and retrieving JSON data, thus bridging NoSQL and relational concepts.

After that we're joined by the NoSQL/document store solutions. Microsoft's own Azure Cosmos DB, as well as the "original" called MongoDB enter the comparison with SQL Server in terms of features and limitations, pros and cons. Eventually we'll know when to prefer which solution.

Wie ist das jetzt mit JSON in meiner Datenbank? en de

Das Datenformat JSON, auch Hipster's XML genannt, ist allgegenwärtig, nicht nur in Javascript-Umgebungen. In dieser Session sehen wir uns zunächst an, wo es herkommt, wie es aussieht und wofür man es nutzen kann.

Danach finden wir heraus, wie der SQL Server mit JSON umgeht. Obwohl kein eigener Datentyp dafür bereitsteht, gibt es ausgefeilte Funktionen, um JSON zu speichern und zu verarbeiten, und so NoSQL- und relationale Konzepte zu verbinden.

Schließlich holen wir die NoSQL/document store-Lösungen dazu. Microsofts eigene Azure Cosmos DB, sowie das "Original" namens MongoDB stellen sich dem Vergleich zum SQL Server in punkto Features und Beschränkungen, Vor- und Nachteile. Am Ende werden wir wissen, welche Lösung wann zu bevorzugen ist.

Pimp your Power BI with R en de

We all know that Power BI is the top enterprise analytics and BI platform according to Gartner, Forrester (and of course Microsoft). And it's true, with Power BI you can share valuable insights through rich reports and dashboards.

But another ecosystem has earned high merits for data analysis, visualization and data science in the past decades - the R language. Why not combine the best of both worlds? And you can!

In this session you'll learn what it takes to connect your Power BI Desktop to R and how R functionality can be extended by installing packages.
We'll explore how to enhance your Power BI reports with even more stunning R visuals and how to take advantage of R scripts for smooth data ingestion and transformation.

Pimp your Power BI with R en de

Wir wissen alle, daß Power BI die Top Geschäfts-Analyse- und BI-Platform ist, laut der Studien von Gartner, Forrester (und natürlich Microsoft). Und es stimmt, mit Power BI kann man wertvolle Erkenntnisse in Reports und Dashboards darstellen.

Aber noch ein Ökosystem hat sich in den letzten Jahrzehnten hohes Ansehen in Sachen Datenanalyse, Visualisierung und Data Science verdient - die Sprache R. Warum also nicht das Beste aus beiden Welten kombinieren? Genau das kannst Du!

In dieser Session lernst Du, was man braucht, um den Power BI Desktop mit R zu verbinden, und wie man die Funktionalität von R mit Packages erweitern kann.
Wir untersuchen, wie man Power BI-Berichte mit beeindruckenden R-Visuals weiter verbessern und R-Skripts für reibungslosen Datenimport und -transformation nutzen kann.

Data Innovation Summit 2023 Upcoming

Data Profiling done right from the start

May 2023 Stockholm, Sweden

NDC London 2023 Upcoming

50 ways to show your data

January 2023 London, United Kingdom

Data Saturday Slovenia 2022 (Online) Upcoming

What are SQL statistics and why should the developer care?

December 2022 Ljubljana, Slovenia

SQL Days 2022

Pimp your Power BI with R

October 2022 Erding, Germany

Dataminds Connect 2022

What are SQL statistics and why should the developer care?

October 2022 Mechelen, Belgium

Techorama 2022

So, what about JSON in my database?

May 2022 Antwerpen, Belgium

Data Weekender CU5 (online)

What are SQL statistics and why should the developer care?

May 2022 Zoetermeer, Netherlands

SQL Bits 2022

Hunting for fraud with Benford's law in R

March 2022 London, United Kingdom

Data Saturday Slovenia 2021 (Online)

A Journey through the Tidyverse

December 2021 Ljubljana, Slovenia

IT-Tage 2021 (Online)

50 ways to show your data

December 2021 Frankfurt am Main, Germany

Update Conference 2021

So, what about JSON in my database?

November 2021 Prague, Czechia

Data Weekender 4.2 (Online)

An R primer for SQL folks

November 2021 Amsterdam, Netherlands

Data Innovation Summit 2021

50 ways to show your data – condensed edition

October 2021 Stockholm, Sweden

SQL Days 2021

What are statistics and why should the developer care?

October 2021 Erding, Germany

Data Saturday Croatia 2021

A refresher on geospatial data in SQL Server

September 2021 Zagreb, Croatia

Data Saturday Malta 2021 (Online)

50 ways to show your data

April 2021 Valletta, Malta

Data Saturday Pordenone 2021 (Online)

Poor man's SQL Server job monitoring with R

February 2021 Pordenone, Italy

Data Saturday Guatemala 2021 (Online)

A journey through the Tidyverse

January 2021 Guatemala City, Guatemala

SQL Saturday Slovenia 2020 (Online)

Poor man's SQL Server job monitoring with R

December 2020 Ljubljana, Slovenia

DDD Developer day 2020 (Online)

50 ways to show your data

December 2020 Bradford, United Kingdom

SQL Days 2020

Poor man's SQL Server job monitoring with R

October 2020 Erding, Germany

QL Tech Con '20 (Online)

50 ways to show your data

September 2020 Detroit, Michigan, United States

SQL Bits 2020 (Online)

A journey through the Tidyverse

September 2020 London, United Kingdom

Data Weekender Europe (Online)

50 ways to show your data

May 2020 Amsterdam, Netherlands

DDD North

50 ways to show your data

February 2020 Kingston upon Hull, United Kingdom

Join! Conference 2019

"Can I join you?", one table asked the other
Poor man's SQL Server job monitoring with R

November 2019 Warsaw, Poland

SQL Days 2019

"Can I join you?", one table asked the other

October 2019 Erding, Germany

Data Saturday Holland

A journey through the Tidyverse

October 2019 Utrecht, Netherlands

SQL Saturday Oslo 2019

"Can I join you?", one table asked the other

August 2019 Oslo, Norway

SQL Saturday Rheinland 2019

A refresher on geospatial data in SQL Server

May 2019 Sankt Augustin, Germany

SQL Saturday Stockholm 2019

A refresher on geospatial data in SQL Server

May 2019 Stockholm, Sweden

SQL Bits 2019

An R primer for SQL folks

February 2019 Manchester, United Kingdom

SQL Saturday Slovenia 2018

50 ways to show your data

December 2018 Ljubljana, Slovenia

Join! Conference 2018

A journey through the Tidyverse
50 ways to show your data
A refresher on geospatial data in SQL Server

November 2018 Warsaw, Poland

SQL Days 2018

50 ways to show your data
A refresher on geospatial data in SQL Server

October 2018 Erding, Germany

SQLGla 2018

Next first steps - selected applications of R

September 2018 Glasgow, United Kingdom

SatRday Amsterdam

50 ways to show your data

August 2018 Amsterdam, Netherlands

SQL Saturday Paris 2018

Next first steps - selected applications of R

July 2018 Paris, France

SQL Grillen 2018

50 ways to show your data

June 2018 Lingen, Germany

SQL Saturday Rheinland 2018

Next first steps - selected applications of R

June 2018 Sankt Augustin, Germany

Intelligent Cloud Conference 2018

An R primer for SQL folks

May 2018 Copenhagen, Denmark

Techorama 2018

50 ways to show your data

May 2018 Antwerpen, Belgium

PASS local group Rheinland

50 ways to show your data

April 2018 Köln, Germany

SQL Saturday Iceland 2018

From SQL to R and beyond

March 2018 Reykjavík, Iceland

SQL Konferenz 2018

A journey through the Tidyverse

February 2018 Darmstadt, Germany

SQL Bits 2018

50 ways to show your data

February 2018 London, United Kingdom

IT-Tage 2017

From SQL to R and beyond

December 2017 Frankfurt am Main, Germany

SQL Days 2017

Next first steps - selected applications of R
A journey through the Tidyverse

October 2017 Erding, Germany

SQL Saturday Holland 2017

Next first steps - selected applications of R

September 2017 Utrecht, Netherlands

SQL Saturday Cambridge 2017

A journey through the Tidyverse

September 2017 Cambridge, United Kingdom

PASS local group Ruhrgebiet

A journey through the Tidyverse

June 2017 Essen, Germany

SQL Saturday Rheinland 2017

A journey through the Tidyverse

June 2017 Sankt Augustin, Germany

SQL Grillen 2017

A journey through the Tidyverse

June 2017 Lingen, Germany

Join! Conference 2017

From SQL to R and beyond
Next first steps - selected applications of R

March 2017 Warsaw, Poland

SQL Konferenz 2017

Next first steps - selected applications of R

February 2017 Darmstadt, Germany

SQL Saturday Cambridge 2016

From SQL to R and beyond

September 2016 Cambridge, United Kingdom

SQL Saturday Rheinland 2016

From SQL to R and beyond

June 2016 Sankt Augustin, Germany

Nordic SQL Nexus 2016

From SQL to R and beyond

May 2016 Copenhagen, Denmark

PASS local group Ruhrgebiet

From SQL to R and beyond

April 2016 Essen, Germany

Thomas Hütter

Explorer of Data

Brüggen, Germany