Kursinhalt

Modul 1: Data Science und Grundlagen des Machine Learnings

Kurstag 1: "Introduction to Data Mining and Machine Learning"

This first course day sets the stage by introducing the rationale for Data Mining and Machine Learning in today’s institutions, providing a succinct refresher course for the underlying theory, and then embarking on the grand tour of data mining tasks and methods. As such it sets the stage for the following course days.

Kurstag 2: "Data Science and Machine Learning"

This one-day course will discuss foundational aspects of learning regression models. The lectures will be accompanied by analytical and practical exercises, which will be made available to the participants on OLAT a month before the course. They will be completed in class under the guidance of the tutor. The goal is to understand how to implement a linear regression model with polynomial basis expansion and regularisation, of interpreting the learning curves to understand the fitness of the model for a specific dataset, and  of cross-validation to obtain the model hyper-parameters.

Kurstag 3: "Deep Learning Methods, Techniques and Applications"

Deep learning is a set of machine learning tools that allow us to teach a machine to predict or classify a given problem - without programming. In this introductory deep learning module, the participants learn what deep learning is, where it can be applied (and where not), and how to get started with deep learning in their business domain. The participants will practice the taught methods in class with business application scenarios.

Kurstag 4: "Big Data Processing and Storage"

Im Kursteil "Big Data Processing and Storage" geht es darum, eine Übersicht über Systeme und Techniken für die Datenverwaltung in der Datenanalyse zu geben. Da sehr grosse Datenmengen anfallen können (Stichwort: Big Data), werden skalierbare Systeme benötigt. Neben grundlegenden Techniken schauen wir uns Map-Reduce und Spark etwas genauer an.

Kurstag 5: "Introduction to Text Analytics and Text Mining"

Dieser Kurstag führt ein in die grundlegenden Techniken der Verarbeitung von Texten (Tokenisierung, Lemmatisierung, Wortarten-Klassifikation, Namenserkennung, Geo-Lokalisierung). Darauf aufbauend erläutern wir moderne Methoden der Informations-Extraktion aus Texten sowie der Text-Klassifikation mit unsupervisierten Algorithmen (z.B. Topic Modelling) und supervisierten Verfahren. Der Kurstag umfasst auch eine Einführung in verteilte Semantik und die neuesten Methoden zur Berechnung semantischer Ähnlichkeit (Word Embeddings).

 

Modul 2: Data Science und Anwendungen des Machine Learnings

Kurstag 6: "Visual Analytics

Interaktive visuelle Datenanalyse (interactive visual analytics) ist mehr und mehr ein unersetzliches Mittel, um in grossen Datenmengen unbekannte komplexe Strukturen und Zusammenhänge zu entdecken. Visualisierung nutzt prinzipiell die menschlichen visuellen und kognitiven Wahrnehmungsfähigkeiten aus die vom Computer nach wie vor nur unzulänglich simuliert werden können. Der Computer wird andererseits effizient eingesetzt, um die rechenintensive Analyse und interaktive Darstellung von grossen Datenmengen zu erledigen.

In diesem Kurs werden die wesentlichsten Grundsätze der Datenvisualisierung erläutert. Dies umfasst grundlegende Prinzipien der Darstellung von quantitativen Werten, Farbtheorie und Wahrnehmung, sowie gängige Techniken zur Visualisierung von hoch-dimensionalen Datensätzen. Ansätze wie Scatterplot Matrizen, parallele Koordinaten, radiale Koordinaten, hyperbolic Trees, Treemaps, Glyphs, etc. werden an Beispielen aus der Forschung und Literatur präsentiert.

Den Teilnehmern und Teilnehmerinnen wird ein solider Background vermittelt, der es ihnen erlaubt, den Prozess der Datenvisualisierung besser zu verstehen und informierte Entscheide treffen zu können, um Visualisierungstechniken effizient einsetzen zu können.

 

Im Kursteil "Ethical and Legal Aspects of Big Data" lernen die Teilnehmerinnen und Teilnehmer methodische Ansätze zur ethischen Beurteilung von Problemfeldern kennen und wenden diese auf Probleme bei der Anwendung von Big Data an. Zudem werden die Grundlagen des Datenschutzrechts vermittelt, und es wird untersucht, wie Big Data-Anwendungen mit den Vorgaben des Datenschutzrechts in Übereinstimmung gebracht werden können. Die ethischen und rechtlichen Fragestellungen werden dabei laufend zueinander in Bezug gesetzt und mit den Teilnehmenden kontrovers diskutiert.

Kurstag 8: "Robotics, Self-driving Cars and Drones: From Classic Perception to Deep Learning "

In this course you will learn the building blocks of the algorithms behind self driving cars and drones: localization, mapping, path planning, and perception. 

Kurstag 9: "Clouds and Blockchains"

The CAS course day on "Clouds and Blockchains" will introduce the attendees to an up-to-date perspective on selected cloud computing and blockchain details, describing not only major fundamental concepts, but also how latest research trends could advance or influence the technical market. While clouds can serve as a big data storage, blockchains focus on a distributed system's perspective of persisting electronic facts immutably. Additionally, that course day provides a guided practical part on the two topics, in which attendees can interact hands-on with these technical approaches, while observing selected fundamental concepts in practice. Thus, the use of the attendees own machines is recommended.

Kurstag 10: "Machine Learning in Market Design"

The course day on "Machine Learning in Market Design" will show how machine learning techniques can be used to improve the design of electronic marketplaces. We will first cover some basic economic concepts, including game theory and auction theory. We will then look at large-scale combinatorial spectrum auctions. We will show how machine learning algorithms like support vector regression and deep learning can be integrated into a combinatorial auction. Participants will get an opportunity to practice the new concepts via hands-on exercises.