Kategorie-Archiv: Datenjournalismus

Datenjournalismus: Screenshot des Visualisierung der Einbrüche in Unterfranken

Einbrüche in Unterfranken – ein Datenjournalismus-Projekt

Seit Anfang des Jahres 2014 erfasst die Online-Redaktion der Main-Post Einbrüche bzw. -versuche in Unterfranken. Dabei wird versucht, folgende Aspekte aufzuzeigen: Gibt es Brennpunkt bei den Einbrüchen und zu welchen Uhrzeiten schlagen die Diebe besonders gerne zu? Die Recherche der Einbrüche erwies sich als schwierig.   Zum Hintergrund und den Schwierigkeiten des Datenjournalismus-Projekts habe ich einen Blogbeitrag geschrieben.

Facebook Regierungsanfragen Header

Anfragen an Facebook im Verhältnis zur Einwohnerzahl

Meine Kollegin Angelika hat mich mit ihrem Tweet darauf  gebracht:

Facebook hat also Daten veröffentlicht, in der das Unternehmen die Anzahl von Kontoanfragen von Seiten der Regierungen aufzeigt. Eine naheliegende Vermutung wäre, dass bevölkerungsreiche Länder mehr Anfragen stellen — da es mehr Einwohner gibt, über die man Informationen haben könnte — und bevölkerungsarme Länder weniger.

Also habe ich die Zahl der Anfragen ins Verhältnis zu den Einwohnerzahlen der Länder gesetzt (Google Tabelle mit den Daten). Das Ergebnis hat ich dann durch den Datawrapper gejagt und einfach als Balkendiagramm anzeigen lassen.

Und das Ergebnis: Die Einwohnerzahl spielt nur eine kleine Rolle bei der Frage, ob in einem Land viel oder wenig Regierungsanfragen an Facebook gestellt werden. Absoluter Spitzenreiter ist das kleine Malta mit gut 410 000 Einwohnern und dabei 97 Anfragen im ersten Halbjahr 2013 gestellt haben. Damit käme Malta auf 214 Anfragen pro (rechnerische) Millionen Einwohner, Deutschland zum Beispiel auf 23 Anfragen pro Millionen.

Dirk hat bei Google+ noch angeregt, auch die Zahl der Facebook-Nutzer pro Land einzubeziehen. Das habe ich jetzt auch noch gemacht. Quelle für die Nutzerzahlen war die Statistik vom Juni 2013 bei allfacebook.com, außer die Elfenbeinküste, deren Zahl ich von Facebook habe.

Nach Sekunden brennen die Augen: Ein Konferenzraum voll mit leuchtenden Google-Symbolen

Datenjournalismus und die bunte Google-Welt in Hamburg

Datenjournalismus — zumindest in Deutschland eine relativ neue Form des Journalismus und auf jeden Fall immer gefragter. Mit Daten Geschichten erzählen, ist eine Kunst für sich. Man muss sich oft durch trockene Zahlenwüsten kämpfen, muss Computerprogramme schreiben, um an die Daten zu kommen und sie in eine brauchbare Form zu biegen. Die Daten müssen journalistisch überprüft werden, der Datenjournalist sollte sich mit Datenformaten auskennen und im Idealfall sie auch noch ästhetisch und benutzbar visualisieren können. Ein unter Umständen komplexer, aber unter Umständen sehr interessanter Beruf.

Um unser Wissen in Sachen Datenjournalismus zu verbessern, waren mein Kollege von der Main-Post und ich  in der letzten Woche an der Akademie für Publizistik in Hamburg beim Seminar „Datenjournalismus II“. Dozenten waren Michael Kreil und Lorenz Matzat, beide von OpenDataCity und beide Mitgewinner des Grimme Online Awards 2011 für ihre datenjournalistische Arbeit zur Vorratsdatenspeicherung für Zeit Online anhand der Handy-Positionsdaten des Grünen-Politikers Malte Spitz. Die Jungs wissen also wirklich, was sie tun! 🙂

Zwei Tage lang durften wir im Seminar an einem konkreten Fallbeispiel arbeiten. Wir wollten die Messdaten der Pegel aller Flüsse in Deutschland automatisch auslesen und diese auf einer Karte visualisieren. Dazu gab es Übungen zur Datenrecherche,  im Säubern von Daten mit Excel bzw. LibreOffice oder im Texteditor per regulären Ausdrücken, Einführung in das ScraperWiki und ich habe zum ersten Mal etwas von den sehr lästigen Gauß-Krüger-Koordinaten gehört, mit denen die Pegel auf der Originalkarte leider geocodiert wurden.

Ich muss leider gestehen, dass ich — mit zehn Jahren Webentwicklung und -design auf dem Buckel — nicht sonderlich gefordert wurde. Am meisten noch mit der Tastaturbelegung am MacBook! 😉

Überhaupt habe ich die Dozenten nicht beneidet. Die Vorkenntnisse der Teilnehmer waren sehr unterschiedlich und die Erwartungen recht verschieden, die alle unter einen Hut zu bekommen war nicht einfach. Der Teil der Entwicklung der Visualisierung der Daten — ein Punkt, der mich sehr interessiert hätte — wurde leider nur kurz und nebenbei behandelt, Michael Kreil programmierte sehr schnell den Prototypen einer Anwendung mit Leaflet.

Ulrike Koeppen, eine Kollegin vom BR, hat mit mir am Seminar teilgenommen und ein kleines Storify aufgesetzt.

Datenjournalismus-Treffen und die Innenarchitektur Googles

Schön war es auch Abseits des Seminars. Am Montagabend fand ein Datenjournalismus-Treffen in Hamburg statt — in den Räumen von Google.

Schon das Treffen war interessant, coole Anwendungen wurden gezeigt, die Links stehen im Etherpad der Veranstaltung. Aber wenn man schon mal bei Google im Haus ist, darf eine Führung durch die Firmenräume nicht fehlen. Denn in Hinsicht auf die Inneneinrichtung ist ein Blick in die Büroräume schon ein Erlebnis.

Pressesprecher Stefan Keuchel von Google Deutschland wurde nicht müde zu erwähnen, dass hier auch wirklich hart gearbeitet wird, eine Tatsache, die man bei der bunten und verspielten Einrichtung vieler Gänge und Räume schon mal vergessen kann. 🙂 Ich habe eine paar Schnappschüsse von der Führung gemacht, was auf den Fotos nicht zu sehen ist: dort gibt es auch viele Räume mit Großraumbüros, die einfach wie Großraumbüros aussehen. 😉

diagramm1 (1)

Zielgenaue Werbung bei Facebook – eine Illusion

Noch hat Facebook den Ruf, das El Dorado der zielgenauen Werbung zu sein. Die Nutzer füttern das soziale Netzwerk mit ihren persönlichen Daten — Alter, Geschlecht, Wohnort, Beziehungsstatus, Interessen und so weiter. Und die Firmen können bei Facebook ganz leicht Werbung genau für die von ihnen gewünschte Zielgruppe platzieren — zum Beispiel junge Frauen zwischen 15 und 17 Jahren oder alleinstehende Männer über 65 Jahren.

Die Zielgruppe kann sich die Firma zusammenklicken, es wird auch angezeigt, wie viele Facebook-Nutzer mit dieser Werbung erreicht werden können – wie simpel und praktisch. So wird mir angezeigt, dass ich in meiner Heimatstadt Würzburg zum Beispiel diese Zielgruppe erreichen:

13 360 Personen

  • die in Deutschland leben
  • die in Würzburg wohnen
  • die genau zwischen 15 und 17 Jahre alt sind
Toll, was heutzutage alles geht — 13360 Jugendliche in Würzburg erreichen. Die Freude darüber wird leider durch die harte Wirklichkeit getrübt — laut Bayerischem Landesamt für Statistik gibt es in Würzburg nur 2671 Menschen in dieser Altersgruppe.  Im besten Fall existieren also nur 20 Prozent der angegebenen Facebook-Nutzer mit diesen persönlichen Daten wirklich. Und in anderen Altersstufen sieht es nicht besser aus — erst ab den Gruppen 50 Jahre oder älter  ist die Zahl der Facebook-Nutzer kleiner als die der tatsächliche Einwohnerzahl in diesen Gruppen und könnte damit zumindest möglich.
Die statistischen Daten für das Beispiel Würzburg findet man in dieser Google-Tabelle und sind auch hier als Balkendiagramm dargestellt:
Diagramm - Einwohnerzahl und angebliche Facebooknutzer in Würzburg

Warum könnte das so sein?

  • Nutzer könnten ihr Alter falsch angegeben haben.
  • Firmen, Organisationen, Künstler, Bands, Vereine, etc haben sich bei Facebook als Person mit einem fikitven Alter angemeldet und nicht als Facebook-Seite.

Was ist die Konsequenz daraus?

Facebook-Werbung ist bei Weitem nicht so zielgenau ist, wie es Facebook oder Werbeagenturen gerne hätten — weil die Daten nicht immer die Qualität haben. Denn im gezeigten Beispiel stimmt zumindest die Altersangabe nicht und man wird schon misstrauisch, ob die restlichen Angaben — Geschlecht, Interessen, Wohnort — korrekt sind. Werbung über solche feinen Kriterien — sogenanntes Targeting — würde ich im Gegensatz zu anderen nicht empfehlen.  Zur zielgenaueren Werbung will Facebook nun weitere Daten und auch das Surfverhalten der Facebook-Nutzer zur Verbesserung  verwenden — Datenschützer sind darüber nicht amüsiert.
Update:
Jetzt habe ich auch den Hilfe-Eintrag bei Facebook gefunden, den ich gesucht habe: Facebook gibt zu, dass die Nutzerzahlen nur Schätzungen sind — aber wenn die Abweichungen dermaßen groß sind, ist das für mich schon nicht mehr geschätzt, sondern geraten.

Visualisierung des laut.fm-Netzwerks mit Google Fusion Table

Netzwerke mit Google Fusion Tables

Das Netzwerk von Radio Würzblog
bei der alten laut.fm-Seite.

Die Webradio-Plattform laut.fm, die kleine Schwester der Musik-Website laut.de, arbeitet gerade an einem Relaunch, der schon als Beta-Version zu sehen ist. Eine Funktion, die, wie es im Moment aussieht, dem Umbau zum Opfer fallen wird, ist das sogenannte Netzwerk. Hier konnte ein Radiosender befreundete Radiostationen bei laut.fm eintragen – eine gute Möglichkeit, um den Hörer über den musikalischen Tellerrand lenken zu können.

Um Stand des Netzwerks auf den letzten Metern seiner Existenz zu dokumentieren, durfte wieder mal Google Fusion Tables herhalten.

An die kompletten Netzwerkdaten kam ich über die laut.fm-API. Über den Aufruf von http://api.laut.fm/stations kam ich an die Liste aller Stationen im JSON-Format. Für jeden Sender habe ich dann die jeweilige Netzwerk-Liste über die Network-API erhalten, z. B. http://api.laut.fm/station/wuerzblog/network. Die ganze Schleife lief in PHP und gab eine CSV-Datei aus, die ich dann in eine Google Fusion Table importierte. In der Spalte Station1 steht die Station, dessen Netzwerk-Daten ich aufgerufen hatte, in Station2 die jeweiligen Netzwerk-Sender. Ein Netzwerkpfeil geht also von Station1 zu Station2.

Die Tabelle mit den Netzwerk-Daten in Google Fusion Tables

Über den Punkt „Experiment“ kann man diese Daten dann als Netzwerk darstellen lassen

Visualisierung des laut.fm-Netzwerks mit Google Fusion Table

Die interaktive Karte kann gezoomt werden, die einzelnen Punkte mit der Maus verschoben werden — das Netzwerk verschiebt sich über einen Gummiband-Effekt mit — und wohl aus Perfomancegründen kann die Anzahl der angezeigten Netzwerkpunkte verändert werden. Die Farben geben die Spalte an, in diesem Fall aber uninteressant, da jede Station sowohl in der ersten als auch in der zweiten Spalte auftauchen kann. Ich habe die Farboption eher aus optischen Gründen verwendet.

Und hier sieht man – welcher Sender mag welchen anderen Sender! 🙂


>> Die Netzwerk-Karte in einem eigenen Fenster