Big Data for Black Belt Lean

1 Introductie

Deze cursus is een aanvulling op de traditionele Six Sigma technieken die er specifiek is gekomen om ondersteuning te bieden bij een gekend probleem: te veel data.

Daar waar traditionele technieken vaak focussen op kleine, beheersbare datasets, beschikken veel bedrijven tegenwoordig over gigantische hoeveelheden data over het productieproces, klanten, … Het doorploeteren van deze data is gewoonlijk het werk van specialisten in de statistiek, data-analyse of machine learning. De bedoeling van deze cursus is meer bescheiden:

2 Lectures

Grondslagen van data-analyse We geven een inleiding in de (statistische) fundamenten waarop moderne data analyse gebouwd is. Kernbegrippen zoals kansverdeling, voorwaardelijke kans, marginale kans, … zullen aan bod komen met focus op hoog-dimensionale kansruimten. We zullen daarnaast ook uitgebreid stilstaan bij de “ladder van causaliteit” en de beperkingen van zuiver observationele studies. Slides: licht | donker
Big Data - populaire methoden We gaan een aantal theoretische concepten uit de wereld van de data-analyse verkennen, zoals: de notie van een loss-functie; bias-variance trade-off; cross-validatie; confusion matrices. Slides: licht | donker
Hands-on Big Data Methods We gaan met de hulp van een AI-assistent (zoals ChatGPT of Claude) zelf aan de slag om hands-on modellen te maken voor analyse van data. Afhankelijk van de tijd die beschikbaar is en de interesse van de aanwezige cursisten kunnen volgende onderwerpen aan bod komen: lineaire regressie, beslissingsbomen, neurale netwerken, Bayesiaanse netwerken. Slides: licht | donker