Erläuterungen zur mCLOUD, zu den Datenquellen und zu Nutzungsmöglichkeiten:

  • Was ist die mCLOUD?

    Die mCLOUD ist eine Rechercheplattform zu offenen Daten aus dem Bereich Mobilität und angrenzender Themen. Das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) stellt mit der mCLOUD einen zentralen Zugangspunkt zu allen offenen Daten seines Geschäftsbereiches zur Verfügung und öffnet das Portal auch für private Anbieter aus dem Mobilitätsbereich, um ihre Daten dort anzubieten.

    Die mCLOUD soll in erster Linie Entwicklern in Unternehmen, Forschung und Verwaltung einen direkten Zugang zu Daten bieten. Auf diese Weise soll die Entwicklung innovativer Ideen für den Bereich der Mobilität gefördert werden. Der Datenschatz, der über die mCLOUD zugänglich gemacht wird, wird stetig erweitert. Auch die Funktionalitäten der Plattform werden schrittweise ausgebaut.

  • Welche Daten lassen sich in der mCLOUD recherchieren?

    In der mCLOUD sind Daten aus den Themenbereichen Straßen-, Bahn- und Luftverkehr, Raumfahrt, Klima und Wetter sowie Gewässer und Wasserstraßen zu finden. Für diese Themen sind das BMVI und sein Geschäftsbereich zuständig. Die Daten sind über Schlagworte recherchierbar und direkt zum Download oder zur dynamischen Einbindung in eigene Anwendungen verlinkt. Die Daten selbst liegen nicht in der mCLOUD. Stattdessen verweist die mCLOUD auf Datenschnittstellen und Download-Links der bereitstellenden Behörden und Unternehmen.

    Derzeit sind nur solche Daten in der mCLOUD enthalten, die folgenden Open-Data-Ansprüchen genügen:

    • Geldleistungsfreiheit
    • Leichter Zugang (d.h. keine technischen Hürden, wie Benutzeranmeldung)
    • Maschinenlesbarkeit (d.h. keine Dokumente, wie z.B. PDFs, sondern i.d.R. Zahlenwerte, die durch Messung oder Beobachtung gewonnen wurden)
  • Wer stellt Daten über die mCLOUD bereit?

    In der mCLOUD sind derzeit vor allem Daten von Behörden aus dem Geschäftsbereich des BMVI recherchierbar. Aber auch Daten zu Mobilitätsthemen aus Ländern und Kommunen sind hier zu finden. Die mCLOUD ist ebenfalls offen für Daten von privatwirtschaftlichen Unternehmen, die ihre offenen Daten hier anbieten möchten. Auch Forschungsdaten können in der mCLOUD bereitgestellt werden. Insbesondere soll die Plattform genutzt werden, um Daten aus dem Forschungsprogramm mFUND des BMVI langfristig zugänglich zu machen.

  • Entstehen Kosten durch die Nutzung von Daten, die über die mCLOUD zur Verfügung gestellt werden?

    Nein, die mCLOUD verweist derzeit nur auf Daten, die geldleistungsfrei bereitgestellt werden. Bei der Weiterverwendung der Daten gilt es, die spezifischen Lizenzbedingungen und Nutzungshinweise zu beachten (z.B. Anbringen eines Quellenvermerkes bei Veröffentlichungen).

  • Ist die mCLOUD eine „Cloud“?

    Nein, nicht im klassischen IT-technischen Sinn, da sie weder Speicherplatz, noch Rechenleistung oder Anwendungssoftware als Dienstleistung anbietet. Technisch gesehen handelt es sich um einen Metadatenkatalog. Sie besteht also aus einer Sammlung von Datenbeschreibungen und den zugehörigen Links auf die Datensätze. Die Daten selbst liegen an verschiedenen Orten verteilt, meist auf den Servern der Datenbereitsteller. Insofern fühlt sie sich in der Handhabung an wie eine Daten-Cloud, da man an zentraler Stelle auf die Daten zugreifen kann ohne wissen zu müssen, wo die Daten liegen.

  • Welche Wege gibt es, um auf die Datenquellen zuzugreifen?

    Nicht alle Daten, auf die man in der mCLOUD zugreifen kann, sind einfache Dateien, die man auswählen und mit einem Klick herunterladen kann. Bei einigen handelt es sich z.B. um Daten- oder Programmierschnittstellen. Im Folgenden werden einige Zugangswege erläutert:

    Dateidownload

    Ein Dateidownload ist die einfachste Form einer Datenquelle in der mCLOUD. Hier wird ein einfacher Link zur Datei angegeben, die den entsprechenden Datensatz enthält (z.B. eine Excel-Tabelle). Wenn auf einer Webseite mehrere Dateien verlinkt sind (z.B. zu unterschiedlichen Jahresstatistiken), ist hier meist nur der Link auf die übergeordnete Website angegeben.

    FTP

    Das File Transfer Protocol (FTP) ist eine Schnittstelle zum Herunterladen von Dateien aus dem Internet. Im Browser stellt es sich in Form von Ordnerstrukturen - ähnlich denen im Windows Explorer - dar. Dateien können durch einfaches Aufrufen von Links heruntergeladen werden, entweder im Browser, einem FTP-Client oder direkt aus einer Anwendung heraus.

    API

    Eine API (Application Programming Interface) ist eine Programmierschnittstelle, die den direkten Zugriff auf ein Programmteil (z.B. eine Datenbank) aus einem anderen Programm ermöglicht. Hier werden insbesondere Webservices darunter verstanden, die im Gegensatz bspw. zur FTP-Schnittstelle das direkte Einbinden sich dynamisch verändernder Daten in eigene Anwendungen und die interaktive Auswahl unterschiedlicher Parameter ermöglichen. Daten müssen dank einer solchen Schnittstelle nicht heruntergeladen und weiterverarbeitet werden. Häufige Schnittstellen und Datenaustauschformate solcher Web-APIs sind:

    • JSON: Javascript Object Notation (JSON) ist ein einfaches Datenaustauschformat. Das Format dient der Kommunikation von Anwendungen untereinander. Die Struktur von JSON-Dateien ist jedoch auch einfach für den Menschen erfassbar und lesbar.
    • REST: Representational State Transfer (REST) ist ein Programmierparadigma für Webservices und verwendet v.a. http-Methoden.
    • SOAP: Das Simple Object Access Protocol (SOAP) ist ein Netzwerkprotokoll zum Datenaustausch.
    • WSDL: Die Webservice Description Language (WSDL) ist eine Beschreibungssprache zum Austausch von Informationen auf Basis von XML.
    • XML: Die Extensible Markup Language (XML) ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten.
    • YAML: Die vereinfachte Auszeichnungssprache YAML (YAML Ain’t Markup Language) dient dazu, komplexere Datenstrukturen zu serialisieren. Damit ist sie wesentlich leichter für Menschen lesbar, als bspw. XML, und dient der vereinfachten Weiterverarbeitung von Daten.

    Atom Feed

    Ein Atom Feed ist ein Datenformat zum Austausch von Informationen, in diesem Fall von Datensätzen. Die Funktionsweise entspricht der von RSS Feeds. Innerhalb der Atom Feed finden sich Informationen zu den Datensätzen sowie Links für das Herunterladen der Daten.

    SOS

    Sensor Observation Service (SOS) ist ein Webservice zur Abfrage von Sensordaten, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. Mit Hilfe dieses Dienstes können Echtzeit-Sensordaten interaktiv abgefragt werden.

    WCS

    Web Coverage Service (WCS) ist ein Geodatendienst-Standard, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. WCS-Dienste dienen der Bereitstellung von Geodaten in Rasterformaten. Über verschiedene Operationen können die Daten heruntergeladen werden.

    WFS

    Web Feature Service (WFS) ist ein Geodatendienst-Standard, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. WFS Dienste dienen der Bereitstellung von Geodaten in Vektorformaten. Über verschiedene Operationen können die Daten heruntergeladen werden.

    WMS / WMTS

    Web Map Service (WMS) ist ein Geodatendienst-Standard, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. WMS Dienste dienen der Bereitstellung von Geodaten als Karten. Über verschiedene Operationen können Karten sowie Informationen zu den Karteninhalten heruntergeladen werden. Beim Web Map Tile Service (WMTS) werden die Geodaten kachelbasiert angeboten, was für viele Anwendungen die Performanz erhöht.

    Portal

    Portale sind Datenquellen, in denen der beschriebene Datensatz bereits aufbereitet verfügbar ist. Zumeist handelt es sich hierbei um Geoportale oder Kartenviewer, in denen die entsprechenden Geodaten visualisiert dargestellt werden, oder um andere Open-Data-Portale.

  • Was sind häufige Datenformate, die über die mCLOUD heruntergeladen werden können?

    In der Übersicht findet sich hinter jedem Datensatz, der als Dateidownload oder per FTP-Verbindung angeboten wird, ein Symbol mit der Bezeichnung eines Datenformates. Dieses Symbol gibt einen Hinweis auf das Format, in dem die Daten vorliegen. Häufige Datenformate sind:

    ASCII

    ASCII (American Standard Code for Information Interchange)-Dateien beinhalten eine einfache Zeichenkodierung und sind letztlich einfache Textdateien mit darstellbaren Zeichen. Oft sind Reihen von Messdaten in dieser Form kodiert.

    BUFR

    BUFR (Binary Universal Form for the Representation of meteorological data) ist ein Datenformat, das in erster Linie benutzt wird, um meteorologische Beobachtungen zu enkodieren, z.B. die von synoptischen Stationen, Radiosonden und Satelliten. Das Format wird von der World Meteorological Organisation (WMO) eingesetzt und weiterentwickelt.

    CSV

    Das Dateiformat CSV (Comma-separated values) beschreibt den Aufbau einer Text / ASCII-Datei zur Speicherung von Daten. Insbesondere Tabellen und Listen werden im CSV-Format abgebildet.

    DATEX II

    Datex II basiert auf einer XML-Syntax und ist ein europaweiter Standard zum Austausch von Mobilitätsdaten. Ursprünglich wurde der DATEX-Standard im Straßenbereich für den Informationsaustausch zwischen Verkehrsmanagement- und –informationszentralen entwickelt. Die zweite Generation des Standards, DATEX II, eröffnet auch anderen Akteuren im Verkehrssektor Anwendungsmöglichkeiten. Je nach Anwendungsfall gibt es verschiedene Datenmodelle, z.B. für Verkehrs- und Umfelddaten, für Baustellen oder für intelligentes LKW-Parken.

    Excel (XLS, XLSX)

    Von Microsoft entwickeltes Dateiformat zur Speicherung von Daten aus Tabellenkalkulations- und Datenbankprogrammen.

    GeoJSON

    Offener Datenstandard zum Austausch von Geodaten.

    GML

    Die Geography Markup Language (GML) basiert auf der Auszeichnungssprache XML und erlaubt den Austausch geografischer Objekte mit Attributen, Relationen und Geometrien. Internetfähige Geräte können hierüber einen direkten Zugriff auf geobezogene Daten erhalten.

    GRIB / GRIB2

    GRIB ist ein standardisiertes, komprimiertes binäres Datenformat, das vor allem in der Meteorologie verwendet wird.

    KML

    Die Keyhole Markup Language (KML) hat eine XML-Syntax und ist eine Auszeichnungssprache zur Beschreibung von Geodaten. Ursprünglich wurde sie in Google Earth verwendet und wird inzwischen vom Open Geospatial Consortium (OGC) weiterentwickelt.

    netCDF

    Das binäre Datenformat netCDF (Network Common Data Format) dient insb. dem Austausch wissenschaftlicher Daten und wird vor allem in der Klimatologie und im Geoinformationswesen verwendet.

    Shapefile (SHP)

    Ein von der Firma ESRI entwickeltes Dateiformat für Geodaten.

    TIFF / GeoTIFF

    Das Tagged Image File Format (TIFF) ist ein Dateiformat zur Speicherung von Bilddaten. Im GeoTIFF-Format beinhalten die Bilddaten auch Geokoordinaten.

    TXT

    Textdateien sind Dateien, die darstellbare Zeichen enthalten (im Gegensatz zu Binärdateien).

    XML

    Die Extensible Markup Language (XML) ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten.

  • Was bedeuten die Angaben zur Aktualität des Datensatzes und zur Datensatzbeschreibung?

    In der Regel wurden die Daten selbst zu einem bestimmten Zeitpunkt erhoben oder gelten für eine bestimmte Zeitspanne. Außerdem wurde die Beschreibung der Daten (Metadaten) zu einem bestimmten Zeitpunkt erstellt oder aktualisiert. Die Aktualität der Datensatzbeschreibungen (Metadaten) ist immer mit einem konkreten Datum angegeben. Für die Daten selbst können neben einem konkreten Erstellungsdatum auch andere Zeitangaben gelten, wie z.B.:

    Jahr (z.B. 2018)

    Der Inhalt der Daten bezieht sich auf ein bestimmtes Jahr. Ein Beispiel hierfür sind jährliche Statistiken.

    Monat Jahr (z.B. April 2006)

    Daten entsprechen dem Stand eines bestimmten Monats in einem Jahr, beispielsweise monatliche Statistiken.

    Jahr/Jahr (z.B. 2006/2008)

    Die Daten setzen sich aus Informationen verschiedener Jahren zusammen.

    Monat Jahr, Monat Jahr (Oktober 2015, März 2016)

    Es liegen Daten aus (unregelmäßig) aufeinanderfolgenden Zeitpunkten vor.

    Jahr – Jahr (z.B. 1959-2014)

    Daten entsprechen einer (regelmäßigen) Zeitreihe.

    Heute (gestern, vorgestern)

    Die Daten werden täglich aktualisiert. Der aktuellste Datensatz gilt für den heutigen (gestrigen, vorgestrigen) Tag.

    Echtzeit

    Es handelt sich um Echtzeitdaten oder nahezu Echtzeitdaten, die regelmäßig (oder unregelmäßig) aktualisiert werden.

  • Welche Werkzeuge gibt es, um mit den Daten zu arbeiten?

    Die meisten der in der mCLOUD angebotenen Daten sind nicht „selbsterklärend“. In der Regel benötigt man eine Software, um die Daten visualisieren, interpretieren und weiterverarbeiten zu können. Viele Daten können bereits in gewöhnlichen Tabellenkalkulationsprogrammen geöffnet werden, für andere, z.B. für Geodaten, benötigt man spezielle Geoinformationssysteme (GIS). Für folgende Datenformate sind beispielhaft einige Softwarepakete aufgelistet, die für eine Weiterverarbeitung der Daten geeignet sind. Es wird hier nur Open-Source-Software verwiesen; selbstverständlich gibt es auch proprietäre Softwarepakete mit der gleichen oder teilweise erweiterten Funktionalität.

    Tabellenkalkulationsprogramme (für Daten in Tabellenform, wie z.B. XLS, XLSX, CSV, TXT)

    Desktop-GIS (für Geo-Daten im Vektorformat, z.B. SHP, GeoJSON, GML, KML, WMS, WFS oder im Rasterformat, z.B. GeoTIFF, WCS)

    Software-Bibliotheken zur Verarbeitung von Geo-Daten

    • GDAL/OGR (GDAL = freie Programmbibliothek für die Konvertierung räumlicher Rasterdaten, OGR = ähnliche Funktionen wie GDAL, nur für Vektordaten)
    • GeoTools (freie Java-Bibliothek zur Bearbeitung und Darstellung geografischer Daten)