Data Science Projekte

Data Science Projekte

Im dritten und vierten Semester der Studienstufe erarbeiteten die Schülerinnen und Schüler selbst geplante Projekte zum Thema Data Science.

Die hier beschriebenen Projekte sollen einen kleinen Eindruck geben, mit welchen Themen wir uns in der Studienstufe in Informatik beschäftigen.

Datenvisualisierung globaler Internetgeschwindigkeiten (von Janik Hamann)

Das Skript erstellt eine interaktive dreh- und zoombare Weltkarte in 3D-Ansicht, bei welcher den Ländern abhängig von der durchschnittlichen Breitbandgeschwindigkeit eine Farbe zugeordnet wird. Zeitgleich lassen sich mit dem Mauszeiger Informationen über das jeweilige Land anzeigen. Das entsprechende Fenster zeigt z.B. die Geschwindigkeiten von 2017 und 2018, den „Rangplatz“ des Landes, sowie wie viele Tests zum Ermitteln der Werte durchgeführt wurden. Mit einer Dropdown-Liste lässt sich die Karte zudem Umschalten. So zeigt sie dann stattdessen entweder die Änderung der Geschwindigkeiten von 2017 auf 2018, respektive das Verhältnis von Downloadgeschwindigkeit und Bevölkerungsanzahl des Landes.
Das Skript wurde in Python mit dem Visualisierungmodul „Plotly“ umgesetzt. Die Daten sind von cable.co.uk entnommen und liegen als CSV-Datei vor.

Analyse von E-Mail Providern (von Henry Handford)

Das Ziel meines Projektes war es, den Marktanteil und die durchschnittliche Stärke der Passwörter von E-Mail Providern anschaulich darzustellen.
Meine Datenbank im Format „email:password“ habe ich mit Hilfe von „Regular Expressions“ in Python ausgewertet und anschließend mit Matplotlib graphisch dargestellt.
In dem Ergebnis, in welchem die Graustufe die durchschnittliche Stärke des Passwortes darstellt, sieht man eindeutig, dass die Nutzer von verschiedenen E-Mail Providern verschieden gute Passwörter nutzen.

Quellecode zum Download: analysis.py

Aufrufzahlen von Wikipediaartikeln (von Georg von Bismarck)

Die Idee meines Projekts im Informatikunterricht von Herrn Flohr war es, Aufrufzahlen von Wikipedia im Verhältnis zur Länge des jeweiligen Artikels und weiterer Faktoren wie der Anzahl der Bilder und der Anzahl der Links im Artikel zu bringen, um herauszufinden nach welchen Kriterien Leser Artikel bevorzugen.