Data Science
Einleitung
Online-Phase
An sich sollten die mehr oder weniger selbsterklärend sein: Geht durch allen Text und die Videos entsprechend des Termin-Überblicks weiter unten. Die Fragen, Übungen, etc. dienen der Selbstüberprüfung, ob man alles verstanden hat. Die Fragen stellen gleichzeitig den Inhalt dar, den man aus einer Einheit Kapitel mitnehmen, d.h. wissen sollte. Diese bilden auch so ungefähr die Basis der Übungen, welche bestanden werden müssen.
Die Übungen enthalten teils Wiederholungen aus früheren Einheiten zur Auffrischung.
Die Übungen werden kontinuierlich erweitert, um ein großes Repertoire an Übungen zu haben – selbst coden ist die beste Methode, um es zu erlernen.
Ein paar Bemerkungen zu den Videos, Quizzes, Übungen, …
Um den Import von Daten zu erleichtern, bin ich auf eine neue Methode umgestiegen, da das Importieren aus einem Verzeichnis aus verschiedenen Gründen zu vielen Problemen führt. Dateien werden nun einfach über ein package geladen, wie das funktioniert ist haben lernen wir in der ersten Präsenzphase, und ist entsprechend in Kapitel 13.1.2 nachzulesen.
In den Videos werden Datein oftmals noch über den Befehl pd.read_csv()
eingelesen. Das kann einfach durch eben erwähnte Methode ersetzt werden, in allen auf dieser Seite zur Verfügung gesetellten Codes wird mag4
verwendet, wenn also diese kopiert und ausgeführt werden sollte es über mag4
funktioneren. Eine Internetverbindung ist dafür nötig, und mag4
must installiert sein – s. Kapitel 13.1.2.
Die Videos werden nach und nach aktualisiert, um dem Rechnung zu tragen, sowie andere Änderungen etc. einzufügen.
Interaktive Elemente in den Code-Blöcken können zwar bewegt werden, jedoch werden die nicht evaluiert, d.h., das Ergebnis verändert sich nicht.
Präsenzphase
In der Präsenzphase im Anschluss an eine Einheit sprechen wir die hier angebotenen Übungen nicht durch – allerdings können und werden wir natürlich Fragen oder Unklarheiten besprechen. Ansonsten werde ich Übungen mitbringen, welche die gesamte Einheit noch mal in einen Sinnzusammenhang stellt (so der Plan). Mit fortschreitendem Kurs wird der Sinnzusammenhang der Aufgaben dann immer weiter über mehrere/alle Einheiten erweitert, sodass nicht für sich stehende Wissenbrocken gelernt werden, sondern auch komplexe Aufgaben gelöst werden können. Das ist die Idee der ›Flipped Classroom‹ Methode.
Informationen zu den erfolgreich zu absolvierenden Übungen
Termine & relevante Befehle zu den Übungsaufgaben (plus sehr grundlegendes Wissen wie, was ist ein String, was eine globale Variable, warum/wann indents, was ist ein dataframe, was ist ein json file, o.ä.)
20. Mai
[]
, sum()
, len()
, round()
, .append()
, for ... in ...
, def ...
, global
pandas
.columns
, .tolist()
Extrahieren von Spalten und Zeilen mit .loc
Erstellen eines Filters mit <
, >
, &
, |
matplotlib.pyplot
.plot()
, .scatter()
, xlabel()
, ylabel()
ipywidgets
interact()
mag4
.get_data()
10. Juni + Zweit-Termin der vorigen Übungsaufgaben
if ... elif ... else
, { }
, str()
Elemente aus der ersten Übung können enthalten sein, ist aber nicht der Schwerpunkt.
Anwenden einer einfachen list comprehension.
matplotlib.pyplot
fig
, .subplots()
, ax
, .errorbar()
Einfaches erstellen mehrfacher plots in einer figure
numpy
.random()
, .linspace()
requests
requests
, .get()
, .json()
pandas
~
, .str.contains()
, .value_count()
15. Juli + Zweit-Termin der vorigen Übungsaufgaben
Statistik
.describe()
numpy
.random.normal()
, .random.exponential()
streamlit
.write()
, .dataframe()
, .selectbox()
, .multiselect()
, .columns()
, with
, how to plot
Was ist
- GitHub
- Streamlit
- Codespaces
- requirements
- Bokeh
- vibe coding
22. Juli Zweit-Termin der vorigen Übungsaufgaben
Die Veranstaltung besteht aus
ca. 100 Seiten Skript (wäre es ein pdf) >40 Videos mit >10 Stunden Material
>30 jupyter Übungs-notebooks Selbstlern-Fragen mit Antworten
>20 Aufgaben zur gemeinsamen Lösung in den Präsenzphasen
Wie zu schauen ist – oder zumindest: wie geschaut werden kann
Anhalten, nachvollziehen, eventuell zurückspulen und dazu eigenen Skizzen oder Mitschriebe anfertigen.
Termin-Überblick
zu schauen bis Dienstag, …
22.04. – 1 Installation & erste, einfache Programme [06:38]
29.04. – 2 Rufe eine selbst geschriebene Mischungs-Funktion auf [39:17]
06.05. – 3 Erste Schritte in ›Data Science‹ [43:21]
13.05. – 4 Interaktive Elemente & erste Programme [41:42]
20.05. – 5 Komplexeres Plotten & Statistik I [57:38]
27.05. – 6 Statistik II – Regression & Darstellung von Fehlerbalken [40:29]
03.06. – 7 API Requests und Auswertung [1:03:22]
10.06. – 8 Digital Literacy [als Vorlesung]
17.06. – 9 Ausfall wegen Geländeübung
24.06. – 10 Statistik III – Beschreibende Statistik [41:28]
01.07. – 11 Statistik IV - Verteilungen & Fits [32:14]
08.07. – 12 GitHub & Streamlit – Einführung in interaktive Web-Tools [47:30]
Viel Spaß mit dem Kurs!