Skip to content

Latest commit

 

History

History
142 lines (86 loc) · 14.6 KB

README_DE.md

File metadata and controls

142 lines (86 loc) · 14.6 KB

German COVID-19 Forecast Hub - Zusammenstellung von Vorhersagen für COVID-19 Todesfälle in Deutschland

Description in English available here.

Website:: https://kitmetricslab.github.io/forecasthub/

Studienprotokoll:: https://osf.io/cy937/registrations

Referenz: Bracher J, Wolffram D, Deuschel, J, Görgen, K, Ketterer, J, Gneiting, T, Schienle, M (2020): The German and Polish COVID-19 Forecast Hub. https://github.com/KITmetricslab/covid19-forecast-hub-de.

Web tool zur Visualisierung von Vorhersage-Dateien vor der Einreichung: https://jobrac.shinyapps.io/app_check_submission/

Kontakt: forecasthub@econ.kit.edu

Zweck

Dieses Repository dient dazu, Vorhersagen für kumulative und inzidente COVID-19-Todeszahlen in einem standardisierten Format zusammenzutragen. Es wird von Mitgliedern des Lehrstuhl für Ökonometrie und Statistik am Karslruher Institut für Technologie und der Computational Statistics Gruppe am Heidelberger Institut für Theoretische Studien betrieben, siehe Auflistung unten.

Eine interaktive Visualisierung der verschiedenen Vorhersagen und weitere Informationen (auf English) sind auf unserer Webseite verfügbar.

Wir führe eine präregistrierte Evaluationsstudie durch, in der wir die Vorhersagequalität verschiedener Modelle in den Monaten Oktober 2020 bis März 2021 untersuchen, siehe hier für das Studienprotokoll.

Dieses Projekt ist vom US COVID-19 Forecast Hub inspiriert, der vom Reich Lab / UMass-Amherst Influenza Forecasting Center of Excellence betrieben wird. Wir stehen in engem Austausch mit dem Reich Lab und übernehmen weitgehend die dort festgelegten Strukturen und Datenformate, siehe auch diesen Wiki-Eintrag (auf englisch). Ausserdem verwenden wir vom ReichLab zur Verfügung gestellte Software (siehe unten).

Falls Sie an Vorhersagen für COVID-19-Todesfälle in Deutschland arbeiten und gerne zu diesem Repository beitragen möchten treten Sie bitte mit uns in Kontakt

Vorhersageziele

Todeszahlen

Unser Hauptfokus liegt auf 1 bis 30 Tages und 1 bis 4 Wochen-Vorhersagen für inzidente und kumulative Todeszahlen. Wir akzeptieren auch Vorhersagen bis zu 130 Tage oder 20 Wochen voraus. Dieser Wiki-Eintrag (auf englisch) beinhaltet eine genauere Beschreibung der Vorhersageziele. Es gibt keine Verpflichtung, Vorhersagen für alle genannten Ziele abzugeben und es bleibt den einzelnen Gruppen überlassen, einzuschätzen, für welche Ziele ihr Modell sinnvolle Vorhersagen generieren kann.

Die Definition unserer Vorhersageziele folgt den hier für den US COVID-19 forecast hub beschriebenen Prinzipien.

Derzeit betrachten wir die ECDC Daten als die zugrundeliegende und vorherzusagende ``Wahrheit'' (ground truth). Für Todeszahlen in den Bundesländern und polnischen Woiwodschaften verwenden wir Daten des Robert Koch Instituts bzw. des polnischen Gedundheitsministeriums, siehe Abschnitt Wahrheitsdaten.

Fälle

Wir akzeptieren ausserdem 1 bis 30 Tages und 1 bis 4 Wochen-Vorhersagen für inzidente und kumulative Fallzahlen, siehe auch Beschreibung hier.

Intensivmedizinische Versorgung

Wir erwägen, demnächst auch Vorhersagen für den Bedarf an intensivmedizinischer Versorgung aufgrund von COVID19-Erkrankungen abzudecken. Daten aus dem DIVI Register könnten als Gundlage für die Definition von Vorhersagezielen dienen.

Die Definition unserer Vorhersageziele folgt den hier für den US COVID-19 forecast hub beschriebenen Prinzipien.

Inhalt des Repositories

Die Hauptinhalte des Repositories sind gegenwärtig die Folgenden:

  • data-raw: Vorhersagedateien in ihrer ursprünglichen Form, d.h. so, wie sie von den verschiedenen Teams zur Verfügung gestellt wurden.
  • data-processed: Vorhersagen im Standardformat.
  • data-truth: ECDC- und JHU-Daten zu COVID19 Todesfällen in einem standardisierten Format

Anleitung zur Einreichung von Vorhersagen

Die Einreichung von Vorhersagen erfolgt via Pull Requests. In unserem Wiki stellen wir eine ausführliche Anleitung zur Einreichung zur Verfügung. Vorhersagen sollten in wöchentlichen Abständen aktualisiert werden, wenn möglich jeden Montag. Als Frist haben wir Dienstag 15:00 gewählt. Neue Vorhersagen können auch an anderen Wochentagen abgegeben werden (nicht mehr als eine pro Tag), diese werden jedoch nicht in Visualisierungen oder Ensembles verwendet (Ausnahme: Falls an einem Montag keine Vorhersage abgegeben wurde verwenden wir Vorhersagen, die am vorangegangenen Sonntag, Samstag oder Freitag abgegeben wurden).

Wir sind bemüht, teilnehmenden Gruppen technische Unterstützung bei der Einreichung anzubieten. Treten Sie hierzu gerne mit uns in Kontakt.

Speicherformat für Vorhersagen

Wir speichern Punktvorhersagen und Vorhersagequantile in einem Langformat mit Informationen zu Datum und Ort, siehe hier. Dieses Format ist weithgehend identisch zu dem im US Hub verendeten Format (siehe hier and hier).

Lizenz und Weiterverwendung der Vorhersagedaten

Die in diesem Repository zusammengetragenen Vorhersagen sind von verschiedenen unabhängigen Teams erstellt worden, in den meisten Fällen zusammen mit einer Lizenz zur Weiterverwendung. Diese Lizenzen sind in den entsprechenden Unterordnern von data-processed enthalten. Teile der Processing- und Analyse-Codes sind angepasste Versionen von Codes aus dem [US COVID-19 Forecast Hub](COVID-19 Forecast Hub) (dort unter MIT Lizenz). Alle hier bereitgestellten Codes stehen ebenfalls unter der MIT license. Falls Sie Daten aus diesem Repository weiterverwenden möchten treten Sie bitte mit uns in Kontakt.

Wahrheitsdaten

Daten zu den beobachteten Todeszahlen beziehen wir aus den folgenden Quellen:

  • European Centre for Disease Prevention and Control (Dies ist unsere bevorzugte Quelle und wird bei der Evaluierung zugrundegelegt.)
  • Johns Hopkins University
  • European Centre for Disease Prevention and Control Dies ist unsere bevorzugte Quelle und wird bei der Evaluierung zugrundegelegt. Polnisches Gesundheitsministerium. Wir beziehen diese Daten aus einem öffentlichen Google Sheet, das von Michal Rogalski betrieben wird. Dies ist unsere bevorzugte Quelle für Daten auf der Bundesland-Ebene. Die Daten sind kompatibel mit den ECDC-Daten auf der Bundesebene. Um die Daten mit den Daten ECDC-Daten auf der nationalen Ebene kompatibel zu machen werden sie um einen Tag verschoben, seiehe hier.
  • Robert Koch Institut. Die Generierung dieser Datensätze erfordert einige Pre-Processing-Schritte, siehe hier. Dies ist unsere bevorzugte Quelle für Daten auf der Bundesland-Ebene. Die Daten sind kompatibel mit den ECDC-Daten auf der Bundesebene.
  • Johns Hopkins University. Diese Daten werden von einer Reihe von Teams zur Generierung von Vorhersagen genutzt. Derzeit (August 2020) ist die Übereinstimmung mit den ECDC-DAten gut, in der Vergangenheit gab es allerdings stärkere Diskrepanzen.
  • DIVI Intensivregister Diese Daten werden derzeit nicht genutzt, wir planen jedoch, künftig auch Vorhersagen basierend auf diesen Daten zusammenzutragen.

Teams, die Vorhersagen bereitstellen

Derzeit tragen wir Vorhersagen der folgenden Teams zusammen. Bitte beachten Sie, dass nicht alle Teams ihre Vorhersagen aufgrund der selben Datengrundlage zu Todeszahlen erstellen. (benutzte Datengrundlage und Lizenz in Klammern).

Vorhersageevaluation und Ensembles

Eines der Ziele des Forecast Hubs ist es, verschiedene Vorhersagen in einer Ensemble-Vorhersage zusammenzuführen, siehe hier für eine kurze Beschreibung des derzeit verwendeten Ansatzes ohne Gewichtung. Aufwändigere datengetriebene Verfahren setzen voraus, dass verschiedene Vorhersagen, sowohl Ensemble-Vorhersagen als auch Vorhersagen einzelner Teams evaluiert und verglichen werden. Wir möchten jedoch betonen, dass es sich hierbei nicht um einen Wettbewerb, sondern um ein kollaboratives Projekt handelt. Die Methoden zur Vorhersageevaluation die Anwendung finden werden sind hier beschrieben.

Forecast hub team

Die folgenden Personen haben zu diesem Projekt beigetragen, entweder durch praktische Arbeit am Repository oder konzeptionelle Arbeit im Hintergrund (in alphabetischer Reihenfolge):

Verwandte Projekte

Wissenschaftliche Publikationen und Preprints

Mitglieder unserer Gruppe haben zu den folgenden Veröffentlichungen oder Preprints im Zusammenhang mit der Vorhersage der COVID-19 Pandemie beigetragen:

Acknowledgements

Das Forecast Hub-Projekt ist Teil des von der Helmholtz-Gemeinschaft geförderten SIMCARD Information& Data Science Pilot Project. Ausserdem gilt unser Dank der Alexander von Humboldt Stiftung deren Unterstützung für Nicholas G. Reich maßgeblich dazu beigetragen hat, die Zusammenarbeit mit dem Reich Lab und dem und dem US COVID-19 Forecast Hub in die Wege zu leiten.

Für die Inhalte dieser Seite sind einzig die Autoren verantwortlich. Diese Seite spiegelt nicht notwendigerweise die Standpunkte des KIT, HITS, der Humboldt Stiftung oder der Helmholtz-Gemeinschaft wider.