The hitchhiker’s guide to Swiss Open Government Data

Open Government Data-Landscape Schweiz

Die Öffnung der Behördendaten wird oft als deren «Befreiung» bezeichnet. Man könnte sie aber auch als «Entkleidung» sehen. Ohne den ursprünglichen Kontext präsentieren sich die nackten Zahlen als ein Haufen Antworten ohne die passenden Fragen. Wie man alte Daten neu einkleidet, darauf sucht die Open Data-Community gerade Antwort

Die Forderung nach mehr Transparenz und Demokratie

Die Öffnung der Behördendaten hat in der Schweiz schon eine längere Geschichte. Als späte Folge des Fichenskandals in den 90er Jahren erliess der Bund 2006 ein Gesetz, das die Bundesbehörden dazu verpflichtet, auf Anfrage fast alle ihrer Informationen herauszugeben.

Das Öffentlichkeitsgesetz wurde eingeführt um den Staatsapparat für die Öffentlichkeit transparenter zu machen. Viele, bisher nur interne, Informationen wurden nun von ihrem dicken Amtsmantel befreit. Zur Freude vieler Journalisten, deren Arbeit dadurch ungemein erleichtert wurde.

Offene Behördendaten

Zur gleichen Zeit entstand die internationale Open Data-Bewegung um Open Knowledge International (OKI). Sie fordert, dass Daten die mit Steuergeldern erhoben werden, für die Bürger unter dem Label Open Government Data (OGD) offen publiziert werden.1 «Offen», das heisst für OKI frei von technischen und rechtlichen Hürden. Eine der Hauptbegründungen war damals wie heute: mehr Transparenz und Demokratie.

Als Schweizer Ableger von OKI setzt sich der Verein Opendata.ch seit 2011 für OGD ein. Der Verein ist in Politik, Medien und der IT-Branche äusserst gut vernetzt und hat zum Beispiel auf Twitter fast 5000 Follower. Das ist weit mehr als ähnliche Lobbyorganisationen wie swissICT oder Energie Schweiz. Twitter gibt auch einen guten Einblick in die Denkweise der Bewegung.

Obwohl offiziell immer wieder auch der potenzielle wirtschaftliche Nutzen von offenen Behördendaten betont wird (geschätzt auf eine Milliarde Franken pro Jahr), sind die Leute, die man antrifft, vor allem eins: Idealisten.

Dieser Eindruck bestätigt sich, als ich Oleg Lavrovsky, den «Crowdsourcing Champion» des Vereins, im Kaffee Effinger in Bern treffe. Aus dem geplanten Interview wird bald eine Grundsatzdiskussion. Lavrovsky sieht offene Daten in Zukunft als unverzichtbaren Teil unserer Infrastruktur. Wie Wasser oder Strom.

Open Data als Nebenprodukt: die Sekundärnutzung

So ist das Thema auch auf den Radar des Bundesrates gekommen, der 2014 eine Open Government Data-Strategie genehmigte.
Er definierte darin ein Massnahmenpaket, das auch die Erstellung einer zentralen Plattform vorsieht: opendata.swiss. Sie sammelt seit 2015 offene Daten aus Bundesämtern, Kantonen, Gemeinden und bundesnahen Betrieben und wird vom Schweizerischen Bundesarchiv betrieben.

Karte mit Kantonen und Bundesämtern. Zeigt welche Kantone ein Öffentlichkeitsgesetz haben und wie ihr Status bezüglich Open Data ist. Die Grösse der Kantone und Städte ist im Verhältnis zur Einwohnerzahl dargestellt. Das hexagonale Kartogramm stammt von Ralph Straumann. Stand 12.9.2017

Nach Möglichkeit geschieht dies automatisch mittels sogenannter Harvester. Die Stadt Zürich hat zum Beispiel bereits 2012 damit begonnen, eine eigene OGD-Plattform aufzubauen. Diese ist so nun auch mit der nationalen Plattform verknüpft und liefert täglich neue und aktualisierte Datensätze.

«Das ist genau der Charme von Open Data», bestätigen mir Marco Sieber und Reto Wick, die OGD-Beauftragten der Stadt Zürich, «dass wir die Daten schon haben. Wir brauchen sie nur noch in geeigneter Form zu publizieren. Das kann man auch automatisieren». Auch der Bundesrat erwähnt diese Sekundärnutzung als eine der Stärken von Open Government Data. Diese sollen ganz ohne Mehraufwand entstehen, einfach als Nebenprodukt der Amtstätigkeit.

Dass das nicht immer so einfach ist, wissen Sieber und Wick selbst am besten. Seit Jahren werben sie an den verschiedenen Stellen dafür, dass sie ihre Daten standardmässig offenlegen. Oft steht oder fällt es damit, ob sich die richtige Person an der entsprechenden Stelle für das Thema interessiert und bereit ist, die internen Prozesse anzupassen.

Jemand, der sich eindeutig für das Thema interessiert, ist Daniel Schweizer von den Parlamentsdiensten. Die Parlamentsdienste publizieren seit Jahren Informationen über Parlamentarier, Vorlagen und Abstimmungsresultate auf parlament.ch. Schon vor einiger Zeit wurde entschieden, die Webseite mit Hilfe einer Daten-API zu befüttern. Diese API zu öffnen war da nur noch ein kleiner Schritt. Mit der Publikation der Schnittstelle produzierten die Parlamentsdienste über Nacht, ohne Mehraufwand, offene Daten. Auch diese sind natürlich bei opendata.swiss eingetragen.

2570 Antworten ohne die passenden Fragen

Landen die Datensätze schliesslich auf opendata.swiss werden sie Teil eines einzigen Datenhaufens. «2570 Datensätze» steht auf der Startseite auf graublauem Hintergrund. Und irgendwie fällt mir die skurrile Geschichte von Douglas Adams ein. Gefragt nach der Antwort auf die Frage «nach dem Leben, dem Universum und dem ganzen Rest“, spuckt der Supercomputer nach 7.5 Millionen Jahren Rechenzeit endlich die Antwort aus: «42». Die passende Frage dazu kennt aber auch der Computer nicht.

So findet sich hier ein grosse Menge Antworten ohne die passenden Fragen. Keine Geschichten, keine Interpretationen oder Meinungen. Einfach die nackten Zahlen. Es liegt nun am Leser selbst, Fragen an die Daten zu formulieren. Wie viel Daten sind denn zum Beispiel überhaupt 2570 Datensätze?

Der Download der Daten wiegt rund 136 GB. Darunter befinden sich GB-schwere Bildarchive aber auch statistische Datensätze, die es kaum auf ein MB bringen. Während ein Bildarchiv aber vielleicht ein paar hundert Bilder von alten Urkunden enthält, haben manche Tabellen über eine Milliarde Einträge.

Übersicht über die Datensätze auf opendata.swiss. Stand 12.9.2017. Details zur Methodik

Ob die Datensätze mit den meisten Einträgen auch die beliebtesten sind, darüber geben die Besucherzahlen Auskunft. Der Datensatz mit den meisten Besuchern, die Krankenversicherungsprämien des Bundesamtes für Gesundheit, liegt im Mittelfeld, was die Anzahl Einträge betrifft. Es sind rund 8 Millionen.

Data Literacy

Einen solchen Dialog mit Daten zu führen bezeichnet man in der Szene als «Data Literacy». Und möglichst jeder soll in Zukunft «data literate» werden. Lavrovsky hat dazu einen Schweizer Ableger der sogenannten School of Data gestartet. Dort bringt er Interessierten bei, mit Daten umzugehen, sie darzustellen und zu interpretieren.

Regelmässig veranstaltet die Community auch sogenannte Hackathons zu verschiedenen Themen wie Finanzen, Energie oder Tourismus. Dort kommen Hacker, Journalisten, Unternehmer und Staatsangestellte zusammen, tauschen Fragestellungen aus und schlagen kreative Lösungen vor.

Manchmal stellt die Community auch fest, dass Daten fehlen oder fehlerhaft sind, so geschehen mit den Nährwertdaten aus dem Schweizer Detailhandel. Weil sich die Detailhändler sträubten, die Daten öffentlich zu machen, begann ein Team an der ETH Lausanne kurzerhand selbst, Produkte zu fotografieren und die Daten zusammenzutragen. Seither hat die Community schon über 18'000 Produkte in den Katalog aufgenommen. Lavrovsky ist von solchen Initiativen begeistert. «Wenn die Organisationen ihre Daten nicht selbst offenlegen, dann macht die Community das eben selbst».

Daten im neuen Gewand

Auch die Öffnung der Transportdaten der ÖV-Unternehmen geschah auf die Initiative interessierter Privatpersonen hin. Viele Pendler haben seither ihren Fahrplan kreativ neu interpretiert. Aber auch Unternehmen machen dem SBB-Fahrplan Konkurrenz. Das innovative Interface von Viadi fand schliesslich sogar Einzug in die neue SBB-App.

Beide Beispiele zeigen, dass in der Öffentlichkeit ein Interesse an offenen Daten besteht. Es ist aber nicht immer so klar, an welchen: «Es ist oftmals kaum mehr nachvollziehbar, wer welche Datensätze nutzt.», sagt Juan Pablo Lovato, Projektleiter Open Government Data Schweiz beim Bundesarchiv. «Aber das liegt ja auch in der Natur offener Daten».

Mehr und mehr stellt sich der Bewegung die Frage, ob sie diese puristische Position beibehalten oder ihre Kräfte auf die spannenden Datensätze konzentrieren will.

Überlässt sie es der Öffentlichkeit allein, sich die spannenden Datensätze herauszusuchen, riskiert sie, dass diese in einem Haufen uninteressanter Daten untergehen und am Ende ungenutzt bleiben.

Wollen die Aktivisten dieses Risiko vermeiden, führt der Weg direkt in eine Art «Marketing für Datensätze». Es stellen sich Fragen zu Zielgruppen, Qualitätskriterien und Kommunikation von Datensätzen. Das macht vieles komplizierter. Es würde aber vermutlich auch den Nutzen der Datensätze deutlich erhöhen.

Statt als Nebenprodukt würde das Datenangebot als Dienstleistung betrachtet werden. Ein Beispiel dafür ist die Firma Uber die ihre Daten über eine Plattform offen legt und das Angebot in Zusammenarbeit mit den Nutzern stetig verbessert.

Ob das funktioniert, hängt hauptsächlich von zwei Faktoren ab. Einerseits braucht es die Bereitschaft der Datenanbieter, sich auf die Bedürfnisse der Datennutzer einzulassen. Und damit einen weiteren Schritt in Richtung Offenheit zu wagen.2 3 Andererseits braucht es den Glauben der Politik an offene Daten als Rohmaterial der Zukunft, um die nötigen Ressourcen bereitzustellen.

Ohne diese beiden Faktoren, ist vermutlich der erste Weg, trotz der Risiken, der sicherere.

Dank

Mein spezieller Dank geht die vielen Interviewpartner, die sich Zeit genommen haben, mir ihre Sichtweise von OGD in der Schweiz darzulegen:

Methodik

Informationen zu den einzelnen Datensätzen wurden über die opendata.swiss-API abgefragt.

Um die Dateigrösse und die Anzahl der Einträge zu ermitteln wurden alle Daten heruntergeladen. Davon ausgenommen sind Datensätze die als API zur Verfügung stehen oder nicht direkt verlinkt sind. Zur Ermittlung der Dateigrösse wurden die Grössen aller Downloads addiert.

Die Anzahl Einträge wurde aus Zeitgründen nur für etwa drei Viertel der Datensätze ermittelt. Sie funktioniert für die verschiedenen Datentypen folgerndermassen:

  • Tabellarische Daten (TSV, CSV, PC-AXIS, XLS): Anzahl Felder in der Tabelle.
  • Geodaten (Shapefiles): Anzahl Einträge (Punkte, Flächen) × Anzahl Attribute pro Eintrag.
  • Bildaten: Anzahl der Bilder

Die Besucherzahlen wurden freundlicherweise vom Bundesarchiv zur Verfügung gestellt. Die Besucherzahlen für einen Datensatz wurden ermittelt, indem die Anzahl Besucher auf der Seite des Datensatzes und auf allen Unterseiten kumuliert wurde.

Die Karte basiert auf selbst ermittelten Informationen. Sollte ich das OGD-Portal eines Kantosn übersehen haben, bin ich sehr dankbar um Hinweise.


  1. Neben der Verwaltung gibt es auch in anderen Bereichen Bestrebungen, Daten zu öffnen. Speziell auch in der Wissenschaft. Das Thema Open Science Data steht in der Schweiz noch ziemlich am Anfang und wird in diesem Artikel nicht weiter behandelt.  

  2. Huijboom, N., & Van den Broek, T. (2011). Open data: an international comparison of strategies. European Journal of ePractice, 7-8. 

  3. Janssen, M., Charalabidis, Y., & Zuiderwijk, A. (2012). Benefits, Adoption Barriers and Myths of Open Data and Open Government. Information Systems Management, 29(4), 258–268.