+28

Maschinenlesbare Daten (Open Data)


Das Veröffentlichen von großen Datenmengen kann meist dadurch abgeblockt, bzw. ad absurdum geführt werden, wenn die Daten auf Papier ausgedruckt und dem Verlangenden per Post zugesandt werden. Alternativ werden Daten als pdf gespeichert und sind somit für die automatisierte Weiterverarbeitung unnütz. Deshalb fordern wir, dass der Bund Informationen, wie z.B. die Daten zum Bundeshaushalt, maschinenlesbar veröffentlicht.


Diskussionen

  • Sebastian Gießmann ist dafür
    +4

    Da kann man selbstverständlich nur dafür sein. Die Umsetzung braucht aber eine gute gesetzliche Fundierung, vorzugsweise im zu novellierenden Informationsfreiheitsgesetz. Man sollte hier aber die Open Data Principles integrieren und weiter denken:

    Wie sind offene Daten durch Regierungen und Verwaltungen zu publizieren?  vollständig  zeitnah  diskriminierungsfrei  barrierefrei  maschinenlesbar  nicht auf Basis proprietärer Technologien  lizenzfrei  als Primär-/Rohdaten.

    Das ist noch nicht das Ende aller Dinge, die Forderung "alle Daten" muss man differenzierter bearbeiten.

  • NicoleSimon ist dafür
    +3

    Genau, bin ich auch dafür.

    Und nun, damit man mit dem Vorschlag auch nur ansatzweise arbeiten kann: - Welche Relevanz hat der Text bis 'wir fordern'? - wer ist 'wir'? - nur der Bund? Länder? Städte und Gemeinden? - welche Daten? - welche Vorbilder gibt es, an denen man sich einmal orientieren kann? - welche Texte gibt es schon zu dem Thema, auf die man sich beziehen kann? - "Daten" können unterschiedlichen Regelungen unterliegen, zum Beispiel dem Datenschutz. Wie soll damit umgegangen werden, dieses zu ermitteln? Wer bestimmt das? - welche Gesetze sind hiervon eventuell betroffen und müssen gegebenenfalls geändert werden? - In welcher Reihenfolge sollen diese Dinge angegangen werden? - Wer macht die Budgets zum Erstellen dieser so gewünschten "Daten", wie häufig werden sie aktualisiert? - welche Stolperstellen haben diese Projekte überwunden, daß man sie nicht teuer wiederholen muß? - welche verwaltungstechnischen Rahmenbedingungen gibt es jetzt, die geändert werden müssen?

    Technisch: In welchen Formaten sollen "Daten" bereitgestellt werden?

    Das ist eine kurze Sammlung von Fragen die "das Thema" betreffen. Kommen wir wieder zurück auf den Boden des machbaren, die Enquete betreffend:

    In welchen Abschnitt gehört diese noch sehr schwammige Forderung? Was wäre ein druckbarer Istzustand (obiges ist unbrauchbar) und realistische (!) Handlungsempfehlungen?

    Ablauftechnisch: Welche Projektgruppe betrifft das? Wer nimmt dieses in die Hand und bereitet hierzu es entpsrechend vor und gibt den Teilnehmern innerhalb dieses Themenbereiches die zeitlichen Informationen?

    • Wichtig sind vor allem Rohdaten. Niemand will den Haushalt in PDF Piecharts haben. Rohdaten, the real stuff™. Im ersten Schritt müsste wohl festgestellt werden welche Daten (des Bundes / der Länder, der Gemeinden) bereits digital in Rohform vorliegen. Es gibt sicherlich Unmengen digitaler Rohdaten, die ungenutzt auf irgendwelchen Festplatten rumliegen. Wenn man wüsste welche Daten das sind, könnte man diese bereits bestehenden Daten freigeben bzw. über die Freigabe diese Daten konkret diskutieren. Das würde gewissermaßen einen Test-Case darstellen auf dessen Basis man dann generelle Regeln ableiten kann, z.B. wie öffentliche Einrichtungen Daten vorhalten sollen, welche Informationsverarbeitungssysteme ausgetauscht werden müssten um deren Daten in Rohform halten zu können, etc.

  • dirk_s ist dafür
    +3

    idealerweise auch als zugriff auf livesysteme (APIs) anstelle von alten dumps... :)

    • beides gut, für mich gewinnt immer noch der aktuelle dump :-)

    • ich könnte mir vorstellen, dass (aktuelle) dumps, die einfach irgendwo bereitliegen, eher durchsetzbar sind. so ließen sich auch problemlos aus geschlossenen/abgetrennten systemen daten abgreifen.

      "zugriff auf livesysteme" und direkter zugriff auf apis könnte (als forderung) zunächst mehr verschrecken, als nötig wäre. zum beispiel könnte direkter api-zugriff befürchtungen der veränderungsmöglichkeiten an den daten wecken.

  • goma ist dagegen
    +1

    Ich bin eigentlich sehr dafür, dass alle öffentlichen Dokumente in solcher Form veröffentlicht werden. Gebe aber gleichzeitig zu Bedenken, dass dann auch nicht erwünschte Interessenten aus In- und Ausland aus all diesen Daten per elektronischer Rasterfahndung Unmengen indirekter Informationen ziehen und mit anderen Quellen verknüpfen werden oder dies können. Google ist dabei noch ein verhältnismäßig freundlicher Begleiter.... Abgesehen davon sind XML, Excel, csv und JSON auch leicht von jedermann veränderbar. Wenn schon müsste ein read only Verfahren herbei oder zumindest eine "unique trusted online Quelle" als Referenz.

  • presseschauer ist dafür
    +1

    Frau Aigner "verbessert" ja gerade das Verbraucherinformationsgesetz. Im Referentenentwurf ist vorgesehen das einem Kostenaufwand von 1000 Euro der Verbraucher bezahlen muss ( http://j.mp/f5kMzV ). Hört sich erstmal so an als wolle der Staat Geld sparen. Das wird aber den Bürger abschrecken überhaupt von dem Recht Gebrauch zu machen, da die Kosten zu Beginn nicht bekannt sind.

    So geht's nicht.

  • Julia ist dafür
    +1

    Daten zum Bundeshaushalt - und die aktuelle Ausschöpfung der Titel

  • suchenwi ist dafür
    0

    Als Ausführungsbeispiel schlage ich CSV-Dateien vor: Auf Window$ kann man sie mit Excel öffnen, sonst aber auch z.B. mit awk etc.

    • Format (was: Re: Maschinenlesbare Daten (Open Data))

      Also ohne, dass man jetzt vielleicht schon zu sehr ins Detail gehen sollte: aber CSV ist eher eine Krücke. In diesem Fall wäre wohl sowas wie YAML, eine XML-Variante (wobei XML natürlich gerne sehr aufgebläht ist) o.ä. verwenden. Sonst hat man leider immer das Problem, dass man nicht (sicher) weiß, wie Daten zu interpretieren sind bzw. die Daten tragen diese Information nicht gleich mit sich herrum.

      • JSON ist leichtgewichtig, integriert sich hervorragnd in's Web, ist generell sehr einfach zu parsen und verdrängt zumindest im Web XML immer mehr als Standard für den Datenaustausch.

Versionen


    1. Sie können einen Vorschlag unterstützen oder ablehnen.

    2. Und ihn in Ihre Beobachtungsliste aufnehmen.

    3. Informationen über den Vorschlag einsehen...

    4. ...Schlagworte für diesen Vorschlag hinzufügen...

    5. ...oder den Vorschlag mit anderen per Facebook, Google+ oder Twitter teilen.

    6. Kommentare können Sie nicht nur bewerten...

    7. ...sondern auch dazu verfasste Antworten einsehen...

    8. ...selbst eine Antwort zu einem Argument schreiben...

    9. ... und neue Argumente einbringen.

    10. Oder aktiv den Vorschlag mitgestalten und Alternativen einbringen.