Update 25. April 2013: Ich habe eine durchsuchbare und nach Zahlen sortierbare (und repsonsive) Version der Karte erstellt, die vor allem in der Vollansicht sinnvoll ist. Deswegen verlinke direkt in diese Ansicht, statt sie bei maximal 760 Pixeln Breite darben zu lassen.
Mit dieser Karte werden alle 3800 Einträge (bzw. 2285 Einträge an Kreuzungen) angezeigt, die die Berliner Polizei in ihrer „Sonderuntersuchung ‚Radfahrerverkehrsunfälle‘ in Berlin 2011“ auflistet. Angegeben sind Ort und Zahl der Unfälle – weitere Angaben wie Schwere des Unfalls, Verursacher oder Zeitpunkt fehlen. Aber ein erstes Bild vermitteln die Daten sicher.
Ich veröffentliche diese Karte jetzt einfach mal als Demo, deswegen ist sie auch simpel in Google Fusion Tables umgesetzt, und nicht mit Open Street Maps. Auch hat sie keine eigenen Styles und auch kein Suchfeld oder Slider für die Unfallzahlen. Wer so etwas haben möchte, oder Ideen hat, wo so eine Karte unbedingt hinein sollte – gerne!
Das Verfahren
Die Unfalldaten lagen als Tabelle in PDF-Form vor, sie habe ich in einer umfangreichen Suchen-Ersetzen-Aktion in eine Excel-Tabelle verwandelt.
Geocodiert habe ich die Daten mit Marian Steinbachs Python-Script (geogut), das er für offenes-koeln.de für genau so einen Zweck geschrieben hat, Stefan Wehrmeyer war so nett, das Script für die Verarbeitung ganzer Listen zu erweitern. Es beruht auf der Overpass-API, die Open-Streetmap-Daten verwendet.
Der Großteil der Daten (rund 2300) liegt als Kreuzung zweier oder mehrerer Straßen vor – etwa 1500 sind nur als Straße angegeben – bei ihnen wählt das Skript den Mittelwert. Da das bei einer gekrümmten Straße möglicherweise eine Koordinate angibt, die gar nicht auf der Straße liegt, bin ich diese Datensätze gesondert durchgegangen und habe die Koordinaten ggf. korrigiert.
Ein weiterer Aspekt ist die Uneindeutigkeit von Berliner Straßennamen (bedingt durch die jahrelange Teilung und durch die schrittweisen Eingemeindungen), die beim Geocodieren Ausreißer erzeugen kann. Dann liegt plötzlich eine Weddinger Straße in Buckow oder ähnliches. Da das Geogut-Script die Möglichkeit enthält, die Koordinaten einzugrenzen, habe ich beim zweiten Versuch die Grobgrenzen (Nord, Ost, Süd, West) eines jeden Berliner Großbezirks (Friedrichshain-Kreuzberg, Steglitz-Zehlendorf etc.) verwendet. Damit hat das Script sehr zufriedenstellende Ergebnisse produziert.
Zur Veranschaulichung habe ich allen Unfällen unter 10 gleich eine Bubble mit der entsprechenden Zahl verpasst (1 hat einen kleinen Punkt ohne Zahl), für 11-15 großes Grün, für 16-20 großes Gelb, für alles über 20 ein großes Rot. Das ist eine Möglichkeit, ich freue mich aber über Anregungen, wie sich das noch staffeln ließe.
Um datenjournalistisch etwas herauszuholen, müsste man die Unfalldaten mit weiteren Zahlen kombinieren, etwa den Ausgaben des Senats oder der Bezirke für Radwege und Verkehrssicherheit. Dabei stößt man aber auf ein nicht ganz unerhebliches Problem: Diese Daten verbergen sich, sofern sie überhaupt vorhanden sind, extrem tief im Berliner Ratsinfosystem. Dieses System ist nicht aus Sicht eines Bürgers programmiert, sondern bedient Verwaltung und Politiker. Daher freue ich mich auf Anregungen oder Tipps zu Daten und Verwendungszwecken.
Pingback: DS007 Karten :: Datenschau
Pingback: Podcastempfehlung: Datenschau | OpenDGPS