Einheitlich echt

Scientific Data Band 10, Artikelnummer: 367 (2023) Diesen Artikel zitieren

1 Altmetrisch

Details zu den Metriken

Es gibt eine beeindruckende Anzahl von COVID-19-Datenkatalogen. Keines davon ist jedoch vollständig für datenwissenschaftliche Anwendungen optimiert. Inkonsistente Benennungs- und Datenkonventionen, ungleichmäßige Qualitätskontrolle und mangelnde Übereinstimmung zwischen Krankheitsdaten und potenziellen Prädiktoren stellen Hindernisse für eine robuste Modellierung und Analyse dar. Um diese Lücke zu schließen, haben wir einen einheitlichen Datensatz erstellt, der Qualitätsprüfungen der Daten aus zahlreichen führenden Quellen epidemiologischer und umweltbezogener Daten zu COVID-19 integriert und implementiert. Wir verwenden eine weltweit einheitliche Hierarchie von Verwaltungseinheiten, um die Analyse innerhalb und zwischen Ländern zu erleichtern. Der Datensatz wendet diese einheitliche Hierarchie an, um epidemiologische COVID-19-Daten mit einer Reihe anderer Datentypen abzugleichen, die für das Verständnis und die Vorhersage des COVID-19-Risikos relevant sind, darunter hydrometeorologische Daten, Luftqualität, Informationen zu COVID-19-Kontrollrichtlinien, Impfdaten und Schlüsseldaten Demographische Merkmale.

Die anhaltende COVID-19-Pandemie hat weltweit zu weit verbreiteten Krankheiten, Todesfällen und gesellschaftlichen Unruhen geführt. Während die Krise im Bereich der öffentlichen Gesundheit anhält, besteht sowohl ein dringender Bedarf als auch eine einzigartige Gelegenheit, die Ausbreitung des Virus zu verfolgen und zu charakterisieren. Dazu gehört die Verbesserung unseres Verständnisses der räumlich-zeitlichen Sensitivität der Krankheitsübertragung gegenüber demografischen, geografischen, gesellschaftspolitischen, saisonalen und umweltbedingten Faktoren.

Die globalen Forschungs- und Datenwissenschaftsgemeinschaften haben auf diese Herausforderung mit einer Vielzahl von Bemühungen reagiert, Daten zu COVID-19-Fallzahlen, Krankenhauseinweisungen, Mortalität, Impfungen und anderen Indikatoren der COVID-Inzidenz und -Belastung zu sammeln, zu katalogisieren und zu verbreiten1,2. 3,4,5,6,7,8,9,10,11,12,13,14. Obwohl diese Datenbanken eine enorme Menge an Forschung, Risikoüberwachung und öffentlicher Diskussion unterstützt haben, weisen sie oft eine inkonsistente Struktur, Namenskonventionen, Werte, Auflösung, Qualität auf und es mangelt an einer Übereinstimmung zwischen Daten zu Infektionskrankheiten und den potenziellen Risikofaktoren. Diese Probleme erfordern eine mühsame Bereinigung, um Daten aus verschiedenen Quellen zu kombinieren, was den Forschungsfortschritt verzögert und möglicherweise die Qualität beeinträchtigt. Darüber hinaus unterliegen kritische Datensätze, die Risikofaktoren wie Klima und menschliche Mobilität quantifizieren, Verzerrungen und sind nur begrenzt verfügbar, was weitere Herausforderungen für die Datenverarbeitung mit sich bringt.

Um diese unterschiedlichen Datentypen aus unterschiedlichen Quellen auf unterschiedlichen Granularitätsebenen nutzen zu können, müssen sie kombiniert und harmonisiert werden. Ohne ordnungsgemäße Harmonisierung, Kuratierung und Konsistenzprüfung kann die Analyse dieser Datensätze zu falschen Ergebnissen führen. Ein einheitlicher Datensatz, der diese Probleme angeht, wird dazu beitragen, unser Verständnis des COVID-19-Risikos durch mehrskalige räumlich-zeitliche Modellierung zu beschleunigen, indem die zusätzlichen zeitaufwändigen Schritte zur Bereinigung, Standardisierung und Zusammenführung der verschiedenen Datenquellen entfallen. Als Beispiel stellen wir einen Testfall zur Verfügung, bei dem Schätzungen der effektiven Reproduktionszahl (Rt) aus zwei verschiedenen Datenquellen generiert werden, einschließlich gemeldeter Fallzahlen und geschätzter täglicher Infektionen, die direkt aus unserem einheitlichen Datensatz importiert werden, ohne dass die Vereinheitlichung der Variablennamen Zeit in Anspruch nimmt /types und Bereinigen oder Georeferenzieren der Daten.

Daher zielt unser einheitlicher COVID-19-Datensatz darauf ab, (1) Namens- und Kodierungskonventionen aus glaubwürdigen Datenquellen auf mehreren Verwaltungsebenen zu harmonisieren, (2) eine Qualitätskontrolle für COVID-19-Fallzahlen unterschiedlicher Art zu implementieren und (3) potenzielle Prädiktoren systematisch aufeinander abzustimmen mit COVID-19-Daten und (4) bietet Aktualisierungen und Korrekturen in Echtzeit und integriert neue Quellen für relevante Variablen, sobald diese verfügbar sind. Insbesondere enthält der einheitliche COVID-19-Datensatz Schlüsselkomponenten für die Epidemiologie, einschließlich Demografie, Hydrometeorologie, Luftqualität, Politik, Impfung und Zugänglichkeit zur Gesundheitsversorgung, ordnet alle Geodateneinheiten weltweit einer eindeutigen Kennung zu und standardisiert Verwaltungsnamen, Codes, Daten und Daten Typen und Formate vereinheitlicht Variablennamen, -typen und -kategorien. Wir kuratieren die Daten auch, um verwirrende Einträge zu korrigieren, die sich aus widersprüchlichen Namen derselben geografischen Einheiten, unterschiedlichen Berichtsstrategien und -plänen sowie der Anhäufung epidemiologischer Variablen ergeben. Der Datensatz wird in zugänglichen Formaten verteilt und für Anwendungen des maschinellen Lernens optimiert, um reproduzierbare Forschung von hoher Qualität zu unterstützen. Die Verfügbarkeit dieses Datensatzes hat die Analyse von COVID-19-Risikofaktoren auf subnationaler Ebene in mehreren Ländern15,16,17,18 und Studien zu Veränderungen der Risikofaktoren im Verlauf der Pandemie19 erleichtert.

Wir tragen epidemiologische Daten aus unterschiedlichen Quellen zusammen, übersetzen die Datensätze und prüfen die verfügbaren Falltypen. Anschließend werden die Variablen- und Einheitennamen standardisiert und mithilfe einer einheitlichen geografischen Kennung (ID) geokodiert, um die Aggregation auf verschiedenen Verwaltungsebenen und die konsistente Zusammenführung in einer einzigen zeitvariablen epidemiologischen Datensatzdatei zu unterstützen. Die Falltypen, die nicht in den Rohdaten enthalten sind, werden nach Möglichkeit aus den vorhandenen Falltypen abgeleitet (z. B. Ableitung aktiver Fälle aus bestätigten Fällen, Genesungen und Todesfällen). Eine Nachschlagetabelle liefert wichtige geografische Namen und Codes, während die statischen Datenfelder, einschließlich Luftqualitätsschätzungen, in einer separaten Datensatzdatei zusammengefasst werden. Zeitveränderliche hydrometeorologische und politische Daten werden verarbeitet, um die Variablen und Indizes für jede Geodaten-ID mit täglicher Auflösung zu extrahieren. In Übereinstimmung mit den FAIR-Data-Prinzipien20 verfolgen wir einen Ansatz, bei dem die Daten durch einen dauerhaften DOI, geeignete Metadaten und Indizierung auffindbar sind, als kostenlose und offene Ressource zugänglich sind, die über Standardprotokolle abgerufen werden kann, und bei der Verwendung weit verbreiteter Protokolle interoperabel sind Datenformate und -strukturen sowie Wiederverwendbarkeit durch die Bereitstellung von Lizenz- und Herkunftsinformationen und die Einhaltung von Datenstandards.

Der Datensatz folgt dem in Abb. 1 dargestellten Flussdiagramm zur Datenharmonisierung, um unterschiedliche mehrdimensionale Daten über mehrere Typen und Ressourcen hinweg zu integrieren. Mehrere Datentypen erfordern eine Standardisierung, die von der geografischen Identifizierung über den Variablentyp, den Variablennamen bis hin zu Datenstrukturen reicht. Wir ordnen alle Geodateneinheiten einer eindeutigen Kennung zu. Jede Einheit in den Geodatensätzen wird einer eindeutigen Geodaten-ID zugeordnet, die wiederum das Zusammenführen der Datensätze anhand der einheitlichen ID zusammen mit anderen Gruppierungsfaktoren wie Datenquelle, Typ, Variable, Uhrzeit/Datum und anderen Dimensionen ermöglicht. Die IDs auf nationaler Ebene basieren auf ISO 3166-1 Alpha-2-Codes, und für subnationale Daten werden FIPS-Codes (Federal Information Processing Standard) (USA), NUTS-Codes (Nomenclature of Territorial Units for Statistics) (Europa) und ISO 3166-1 verwendet. 2 Codes (globale Provinzen oder Bundesstaaten) und lokale Kennungen (globale Verwaltungsebenen 2 und 3). Dadurch werden auch Verwaltungsnamen, Codes, Daten, Datentypen und Formate mit einheitlichen Variablennamen, IDs, Typen und Kategorien standardisiert, die Daten kuratiert, Datensätze verknüpft und Mehrdeutigkeiten beseitigt, die durch widersprüchliche Namen derselben geografischen Einheiten entstehen und die unterschiedlichen Berichtsstrategien und -pläne.

Flussdiagramm der Datenharmonisierung für den einheitlichen COVID-19-Datensatz.

Zur Georeferenzierung der Daten verwenden wir zunächst die IDs (Identifikatoren oder Codes) und ggf. Shapefiles aus den Originaldatenquellen, um standardisierte Namen in englischer Sprache mit UTF-8-Kodierung abzubilden. Wir implementieren Vereinheitlichungsfunktionen mithilfe von Standardkonvertierungen aus den verschiedenen Kodierungssystemen (z. B. dem NUTS-System (Nomenclature of Territorial Units for Statistics) für Europa, dem Amtlichen Gemeindeschlüssel (AGS) für Deutschland und den FIPS-Codes (Federal Information Processing Standard) für die US-Bezirke und Bundesstaaten) und Einheitennamen in das einheitliche Geodaten-ID-System ein und adressieren alle mehrdeutigen Namen bekannter Duplikate derselben geografischen Einheit über integrierte Neucodierungsfunktionen oder Nachschlagetabellen. Datenvalidierung und Konsistenzprüfungen werden angewendet, um sicherzustellen, dass die standardisierten Namen korrekt zugeordnet werden und mit den ursprünglichen Namen und geografischen Koordinaten übereinstimmen. Wenn eine geografische Einheit in kleinere Teilregionen aufgeteilt wird, werden den höher aufgelösten Einheiten neue IDs zugewiesen. Wenn die IDs und Shapefiles nicht im ursprünglichen Datensatz bereitgestellt werden, werden die Daten nach Namen zusammengeführt und manuell eindeutigen Bezeichnern zugeordnet. Die Einheitennamen werden in standardisierte Codes umgewandelt, wobei problematische Einträge erkannt und manuell überprüft werden. Die Nachschlagetabelle stellt die standardisierten geografischen Namen und Codes bereit, und die Vereinheitlichungsfunktionen werden aktualisiert, um die bekannten Probleme und Ausnahmen bei der Neucodierung zu beheben. Zusätzliche Ansätze werden implementiert, um die anderen Datensatzmerkmale wie Variablentyp, Variablenname und Datenstruktur zu harmonisieren.

Die räumliche Abdeckung des Datensatzes ist in der Weltkarte in Abb. 2 dargestellt und das Geodaten-ID-System ist in Abb. 3 dargestellt. Die IDs auf nationaler Ebene basieren auf ISO 3166-1 Alpha-2-Codes. Die subnationalen Verwaltungsebenen für die Vereinigten Staaten (auf Bundesstaats- und Kreisebene) basieren auf den Codes des Federal Information Processing Standard (FIPS). Für Europa verwenden alle Verwaltungsebenen die Codes der Nomenklatur der Gebietseinheiten für die Statistik (NUTS). Weltweit verwenden die wichtigsten Unterteilungen (z. B. Provinzen oder Bundesstaaten) ISO 3166-2-Codes, während Einheiten mit höherer Auflösung auf lokalen Kennungen basieren (z. B. verwenden Kommunen für Brasilien IBGE-Codes des Brasilianischen Instituts für Geographie und Statistik).

Räumliche Abdeckungskarte für den einheitlichen COVID-19-Datensatz (Administrator 0 = National, Admin 1 = Erste Verwaltungsebene (z. B. Staat, Provinz), Admin 2–3 = Zweite und dritte Verwaltungsebene (z. B. Landkreis, Bezirk).

Geodaten-ID, die für den einheitlichen COVID-19-Datensatz verwendet wird.

Die meisten Komponenten werden täglich aktualisiert, während die zeitaufwändige Datenextraktion für hydrometeorologische Variablen mit und ohne Bevölkerungsgewichtung monatlich aktualisiert wird. Der Datensatz wird über das Center for Systems Science and Engineering (CSSE) der Johns Hopkins University (JHU) verbreitet, die Quelle des weit verbreiteten JHU Coronavirus Dashboard1.

Tabelle 1 fasst die Nachschlagetabellenschlüssel mit den verschiedenen Einheiten-IDs, Namen, Codes, Schwerpunktkoordinaten und Bevölkerung zusammen. Der vollständige einheitliche Datensatz ist auf Zenodo21 verfügbar.

Die täglichen COVID-19-Fallzahlen werden aus verschiedenen Datenquellen, einschließlich dem JHU Coronavirus Dashboard des CSSE, entnommen und auf die Verwaltungseinheiten georeferenziert, in denen sie diagnostiziert wurden1,2,3,4,5,6,7,8,9,10, 11,12. Wir führen mehrere Datenquellen mit unterschiedlichen Falltypen zusammen. Dazu gehört die Übersetzung von Variablennamen aus verschiedenen Sprachen, die Transformation verschiedener Datenformate (z. B. die Akkumulation täglicher Zählungen aus RKI-Daten für Deutschland) und die Überprüfung der aggregierten Zählungen mit allen Datenquellen. Tabelle 2 listet die epidemiologische Datenstruktur auf. Tabelle 3 beschreibt die verschiedenen Falltypen, einschließlich bestätigter Fälle, Todesfälle, Krankenhausaufenthalte und Testergebnisse.

Um die Analyse von Meldeproblemen wie Unterberichterstattung und Einschränkungen der Testkapazität zu erleichtern, haben wir auch die geschätzten täglichen Infektionen des Institute for Health Metrics and Evaluation (IHME)13 integriert. Abb. 4 zeigt einen Vergleich epidemiologischer Schätzungen der täglichen Infektionen und der gemeldeten COVID-19-Fälle sowie der entsprechenden Schätzungen der effektiven Reproduktionszahl (Rt) für die USA. Dies ist auch ein Beispiel für die Nutzung der harmonisierten COVID-19-Daten in unserem einheitlichen Datensatz für Analysen und epidemiologische Schätzungen über verschiedene Datenquellen hinweg, die inkonsistente Standortnamen und -kennungen verwenden könnten. Die epidemiologischen Schätzungen (Fälle nach Infektionsdatum und Rt) werden mit dem Datensatz für die Vereinigten Staaten sowohl auf nationaler als auch auf bundesstaatlicher Ebene bereitgestellt. Diese Schätzungen werden mit den Paketen EpiNow2 und EpiEstim R14,22,23 erstellt. EpiEstim berücksichtigt die Unsicherheit im Mittelwert und in der Standardabweichung des Generationsintervalls durch Neuabtastung über einen Bereich plausibler Werte. EpiNow2 verwendet einen Bayes'schen Ansatz, der auch Verzögerungen bei der Berichterstattung berücksichtigt. Die für Rt-Schätzungen erforderlichen Parameter, insbesondere die Verteilungen der Inkubationszeit und des Serienintervalls, sind der Literatur entnommen24,25,26,27,28.

Epidemiologische Schätzungen und die gemeldeten COVID-19-Fälle für die USA. (A) Geschätzte tägliche Infektionen (gestrichelte Linien) und die gemeldeten Fälle (vertikale Balken); (B) Effektive Reproduktionszahl (R), geschätzt aus der Schätzung der täglichen Infektionen.

Globale und US-amerikanische Impfstoffdaten werden von den Johns Hopkins Centers for Civic Impact für das Coronavirus Resource Center (CRC)29 harmonisiert und integriert. Die Gesamtzahl der vollständig oder teilweise geimpften Personen ergibt sich aus dem bereitgestellten Impfstoff, sofern verfügbar, und den Dosisarten – einschließlich verabreichter Dosen (allgemein oder als erste oder zweite Dosis), zugewiesen oder an Impfstellen versandt/angekommen. Tabelle 4 beschreibt die Datenstruktur der harmonisierten Version des Impfstoffdatensatzes, während Tabelle 5 die verschiedenen Dosistypen auflistet.

Wie bei vielen Viruserkrankungen hängt die Stabilität der aerosolisierten SARS-CoV-2- und COVID-19-Übertragung empfindlich von hydrometeorologischen Bedingungen ab. Menschliches Verhalten und soziale Interaktionen, die Hauptursachen für die Übertragung von COVID-19, sind ebenfalls untrennbar mit den lokalen hydrometeorologischen Bedingungen verbunden. Aus diesen Gründen ist die Fähigkeit dieses einheitlichen Datensatzes, räumlich-zeitliche Variationen hydrometeorologischer Variablen zu charakterisieren, für das Verständnis der COVID-19-Übertragung von entscheidender Bedeutung. Zahlreiche Studien haben Zusammenhänge zwischen der Meteorologie und den Übertragungsraten von COVID-19 festgestellt30,31,32,33. Wie diese Studien jedoch zeigen, sind die identifizierten Zusammenhänge nicht immer in allen Studien konsistent34, es kann Unterschiede im meteorologischen Einfluss zwischen verschiedenen Regionen oder Stadien der Pandemie geben und die relative Bedeutung des hydrometeorologischen Einflusses für die Auswirkung auf breite epidemiologische Trends ist ungewiss. Die Arbeit mit großen, gerasterten hydrometeorologischen Datensätzen kann für Laien eine Herausforderung darstellen, und einfachere Wetterstationsdaten sind nicht immer für große geografische Einheiten repräsentativ.

Um Studien zu ermöglichen, die die Hydrometeorologie in die COVID-19-Vorhersage integrieren, nehmen wir mehrere hydrometeorologische Variablen in unseren einheitlichen Datensatz auf. Tabelle 6 listet die aus NLDAS-2 und ERA5 extrahierten hydrometeorologischen Variablen auf, während Abb. 5 Karten der Durchschnittswerte für 2020 zeigt. Die Bevölkerungsgewichtung wird auf gerasterte Umweltdaten (Hydrometeorologie und Luftqualität) angewendet, um Variationen in der räumlichen Verteilung der exponierten menschlichen Bevölkerung innerhalb jeder Einheit zu berücksichtigen. Die Bevölkerungszahldaten der Gridded Population of the World v4 (GPWv4) mit Anpassung an die Schätzungen der Vereinten Nationen werden vom Center for International Earth Science Information Network (CIESIN) Socioeconomic Data and Applications Center SEDAC35 bezogen. Diese Zahlen werden dann als Gewichte angewendet, indem der Anteil der Bevölkerung innerhalb jeder Einheit auf jeder Ebene der in jeder Rasterzelle enthaltenen Verwaltungshierarchie berechnet, gerasterte Umgebungsvariablen mit diesem Anteil multipliziert und für die Verwaltungseinheit summiert werden. Wir leiten diese Variablen aus dem North American Land Data Assimilation System (NLDAS-2) der zweiten Generation unter Verwendung der meteorologischen Antriebe NLDAS-2 und simulierter oberflächenhydrologischer Felder des Noah Land Surface Model sowie des Europäischen Zentrums für mittelfristige Wettervorhersagen der fünften Generation ab ( ECMWF) atmosphärische Reanalyse des globalen Klimas (ERA5)36,37. Sowohl ERA5 als auch NLDAS assimilieren Beobachtungen und Modellausgaben, um kontinuierliche Karten meteorologischer Variablen ohne Lücken oder fehlende Werte in den Daten bereitzustellen, was mit Beobachtungen allein nicht möglich ist. Die feine räumliche Auflösung von NLDAS (0,125° Breite × 0,125° Länge) und ERA5 (0,25° Breite × 0,25° Länge) stellt erhebliche Verbesserungen gegenüber früheren Datensätzen dar, und beide Datensätze wurden ausführlich anhand von Beobachtungen getestet und es wurde festgestellt, dass sie die beobachteten Größen erfassen36, 37,38. ERA5 und NLDAS sind mit einer Latenz von 4–6 Tagen verfügbar, wodurch sich diese Datensätze besonders gut für die Vorhersage der COVID-19-Dynamik nahezu in Echtzeit eignen. NLDAS ist nur für die angrenzenden Vereinigten Staaten verfügbar, während ERA5 weltweit verfügbar ist.

Globale geografische Verteilung der 10 im Datensatz enthaltenen hydrometeorologischen Variablen – Durchschnitt aller Tageswerte für 2020.

Wir erhalten gerasterte stündliche ERA5- und NLDAS-Daten ab dem 1. Januar 2020. Stündliche Daten werden je nach Variable in tägliche Mittel-, Maximal-, Minimal- oder Gesamtwerte umgewandelt. Auf die hydrometeorologischen Daten wird eine Land-Meer-Maske angewendet, sodass alle Wassergitterzellen von der Analyse ausgeschlossen werden. Für jede Verwaltungseinheit werden zwei Arten von Durchschnittswerten bereitgestellt: einfache Durchschnittswerte und bevölkerungsgewichtete Durchschnittswerte. Eine kleine Anzahl von Verwaltungseinheiten enthalten keine ERA5- oder NLDAS-Gitterzellen, da sie unregelmäßige Grenzen oder geringe Flächenausdehnungen haben (z. B. ~15 % der NUTS-3-Abteilungen). In diesem Fall schätzen wir den Wert meteorologischer Werte am geografischen Schwerpunkt der Einheit mithilfe einer inversen Entfernungsgewichtungs-Interpolationsmethode und berechnen anschließend die einfachen und bevölkerungsgewichteten Durchschnittswerte anhand dieser interpolierten Werte.

Eine langfristige Exposition gegenüber Luftschadstoffen kann die Anfälligkeit für schwere COVID-19-Verläufe erhöhen39,40,41. Wir stellen Langzeitdurchschnitte des oberflächennahen Jahresdurchschnitts von Stickstoffdioxid (NO2) und Feinstaub (PM2,5) bereit, um die Einbeziehung dieser potenziellen Auswirkungen in Studien zu ermöglichen. Wir verwenden einen Datensatz, der Beobachtungen der optischen Tiefe von Aerosolen (AOD) von Erdbeobachtungssatelliten zu globalen Schätzungen von PM2,5 auf Oberflächenebene unter Verwendung geophysikalischer Beziehungen zwischen modelliertem PM2,5 und AOD aus einem chemischen Transportmodell und einer geografisch gewichteten Regressionstechnik42 verwendet. Globale NO2-Schätzungen werden durch Skalierung der vorhergesagten Konzentrationen aus einem globalen Landnutzungs-Regressionsmodell mit jährlichen Satellitenbeobachtungen troposphärischer NO2-Säulen vom Ozone Monitoring Instrument-Satelliten43,44,45 abgeleitet.

PM2,5- und NO2-Datensätze werden von ihren nativen Auflösungen (0,01° Breitengrad × 0,01° Längengrad bzw. 1 km × 1 km) auf 0,05° Breitengrad × 0,05° Längengrad umstrukturiert und über den Zeitraum 2014–2018 gemittelt. Wir berechnen sowohl einfache als auch bevölkerungsgewichtete Durchschnittswerte für PM2,5 und NO2 für Verwaltungseinheiten.

Die in Tabelle 7 beschriebenen zeitlich variierenden Richtlinienreaktionsdaten werden vom Oxford COVID-19 Government Response Tracker (OxCGRT) für die in Tabelle 8 aufgeführten Richtlinientypen verarbeitet, einschließlich vier Kategorien von Richtlinien: (i) Eindämmungs- und Schließungsrichtlinien: C1: Schulschließung, C2: Schließung des Arbeitsplatzes, C3: Absage öffentlicher Veranstaltungen, C4: Einschränkungen bei Versammlungen, C5: Schließung öffentlicher Verkehrsmittel, C6: Anforderungen, zu Hause zu bleiben, C7: Einschränkungen der internen Bewegung und C8: Internationale Reisekontrollen, (ii) Wirtschaftspolitik: E1: Einkommensunterstützung, E2: Schulden-/Vertragserlass, E3: Steuermaßnahmen und E4: Internationale Unterstützung, (iii) Gesundheitssystempolitik: H1: Öffentliche Informationskampagnen, H2: Testpolitik, H3: Kontaktverfolgung, H4 : Notfallinvestitionen im Gesundheitswesen, H5: Investitionen in Impfstoffe, H6: Gesichtsbedeckungen, H7: Impfpolitik und H8: Schutz älterer Menschen und (iv) verschiedene Richtlinien: M1: Wildcard sowie Richtlinienindizes für Eindämmung, Gesundheit, Wirtschaft Unterstützung und Reaktion der Regierung. Die Policen werden danach unterschieden, ob sie für alle gelten (Suffix des Policentyps E), für nicht geimpfte Personen (Suffix des Policentyps NV), für geimpfte Personen (Suffix des Policentyps V) oder für die Mehrheit (Suffix des Policentyps M). Weitere Einzelheiten finden Sie im OxCGRT-Codebuch, der Indexmethodik, dem Interpretationsleitfaden und der subnationalen Interpretation46.

Daten auf nationaler Ebene und Daten der Verwaltungsebene 1 der Vereinigten Staaten zur Prävalenz zugrunde liegender Gesundheitszustände, die mit einem erhöhten Risiko für Morbidität und Mortalität durch COVID-19 verbunden sind, wie in Tabelle 9 beschrieben, wurden von den Centers for Disease Control and Prevention (CDC) aus mehreren zusammengestellt Quellen. Zu diesen komorbiden Erkrankungen gehörten die Prävalenz einer HIV-Infektion (Human Immunodeficiency Virus), Fettleibigkeit, Bluthochdruck, Rauchen, chronisch obstruktive Lungenerkrankung (COPD) und Herz-Kreislauf-Erkrankungen (CVD)47. Darüber hinaus wurden auf nationaler Ebene Indikatoren für den Anteil der Bevölkerung mit einem erhöhten Risiko für COVID-19 aufgrund komorbider Erkrankungen aus den Schätzungen von Clark und Kollegen zusammengestellt und in die einheitliche Datenbank aufgenommen48. Die Daten wurden aus Online-Quellen namhafter Gesundheitsorganisationen, Gesundheitsforschungszentren, internationalen und nationalen Organisationen, Forschungszeitschriften und akademischen Institutionen gesammelt48,49,50,51,52,53,54,55,56,57,58. Nach der Kompilierung wurde die endgültige Datenstruktur in Microsoft Excel mit allen entsprechenden und verfügbaren Daten erstellt.

Die in Tabelle 9 beschriebenen nationalen Fallzahlen der SARS-CoV-1- und MERS-Ausbrüche wurden in die einheitliche Datenbank als Proxy-Indikatoren für Pandemieerfahrungen aufgenommen, die für die Vorbereitung relevant sein können59,60.

Der Zugang der Bevölkerung zur Gesundheitsversorgung und anderen Infrastrukturen kann den Verlauf von Pandemien auf lokaler Ebene beeinflussen, indem er die Kontaktraten und die Einführung neuer infizierter und anfälliger Personen sowie die Geschwindigkeit und Wahrscheinlichkeit beeinflusst, mit der neue Fälle bestätigt, behandelt und behandelt werden in Gesundheitsinformationssystemen registriert. Tabelle 10 listet drei Indikatoren für Barrierefreiheit auf, die im einheitlichen Datensatz enthalten sind. Die Erreichbarkeit der nächstgelegenen Städte über den Landverkehr (Access_City), quantifiziert als benötigte Minuten für eine Strecke von einem Meter, wurde durch Extrahieren zonaler Statistiken aus der Rasterdatei „Accessibility to Cities 2015“ des Malaria Atlas Project (MAP)61 ermittelt. Die Rasterdatei stellt die schnellste Reisegeschwindigkeit von einem bestimmten Punkt zur nächstgelegenen Stadt dar. Sie wurde berechnet, indem die Reisezeit an verschiedenen räumlichen Standorten und topografischen Bedingungen in Rastern abgebildet wurde, in denen das schnellste Transportmittel Vorrang hatte62. Mit einer ähnlichen Methodik nutzten Weiss und Kollegen Daten von OpenStreetMap, Google Maps und akademischen Forschern, um Karten der Reisezeit zu Gesundheitseinrichtungen mit und ohne Zugang zu motorisierten Verkehrsmitteln zu erstellen, aus denen wir die beiden Variablen erhielten, die die Reisezeit (Minuten) charakterisieren. zur nächstgelegenen Gesundheitseinrichtung mit zwei Verkehrsmitteln (Access_Motor: motorisierter Transport verfügbar; Access_Walk: kein Zugang zu motorisiertem Transport) als Indikatoren für den Zugang zur Gesundheitsversorgung63. Während länderspezifische Schätzungen vergleichbarer Barrierefreiheitsmetriken existieren64,65 und in einigen Fällen Vorteile gegenüber den globalen MAP-Produkten bieten können, haben wir letzteren aufgrund ihrer Vollständigkeit der Abdeckung und standardisierten Methodik Priorität eingeräumt, die eine bessere Vergleichbarkeit zwischen Regionen und Ländern bietet.

Tabelle 10 beschreibt die Bevölkerungsdichte und Altersstruktur von WorldPop66.

Die Gesamtbevölkerung (WorldPop), die Bevölkerungsdichte (WorldPop_Density), die Gesamtbevölkerung über 65 Jahre (WorldPop_65) und die Gesamtbevölkerung nach Männern (WorldPop_M) und Frauen (WorldPop_F) wurden durch Extrahieren von Zonenstatistiken mit dem uneingeschränkten globalen Mosaikraster 2020 ermittelt Dateien mit einer Auflösung von 1 km aus den Geodatensätzen von WorldPop, einem harmonisierten Open-Access-Satz gerasterter Geodaten mit globaler Abdeckung, der auf der Grundlage von Volkszählungs-, Vermessungs-, Satelliten- und Mobilfunkdaten erstellt wurde. Das Verhältnis der männlichen zur weiblichen Bevölkerung (Sex_Ratio) wurde berechnet, indem die weibliche Bevölkerung durch die männliche Bevölkerung dividiert wurde.

Die Datenquellen sind in Tabelle 11 aufgeführt.

Die einheitlichen Daten werden vor und nach der Verarbeitung regelmäßig validiert, indem alle Felder mit den verfügbaren maßgeblichen Datenquellen wie der Weltgesundheitsorganisation (WHO), den US-amerikanischen und europäischen Zentren für die Kontrolle und Prävention von Krankheiten (CDC) überprüft und verglichen werden verschiedene Quellen9,10,11. Alle erheblichen Abweichungen oder unrealistischen Daten (z. B. fehlerhafte Datenfelder oder -typen, negative Zählungen und unplausible Werte) werden automatisch erkannt, indem der Typ der Datenfelder (z. B. Ganzzahl, Doppel, Zeichen oder Datum) und die Rate der täglichen Änderungen überprüft werden Untersuchen und korrigieren Sie die einheitlichen Daten sowie das automatische Anomalieerkennungssystem des JHU CSSE, das darauf ausgelegt ist, abrupte Spitzen oder negative Anstiege der täglichen Fallzahlen zu erkennen. Die Anomalieerkennung und Datenkorrekturen werden nach Geodaten-ID gruppiert und berücksichtigen aktuelle Trends, die Gesamtbevölkerung und die Datenquelle. Darüber hinaus werden die Geodaten-IDs mit den entsprechenden ISO-Codes und Shapefiles für alle geografischen Einheiten überprüft. Alle Komponenten des Datensatzes werden täglich aktualisiert, um alle rückwirkenden Änderungen gegenüber den Originalquellen zu synchronisieren, einschließlich etwaiger Korrekturen oder Neuzuordnungen der Fallzahlen. Der aktualisierte Datensatz bietet Forschern genauere und aktuellere Informationen zur Modellierung und Analyse der COVID-19-Übertragungsdynamik und Zusammenhänge mit Umweltbedingungen.

Hydrometeorologie- und Luftqualitätsdaten stammen alle aus Datenquellen, die ihre eigenen umfangreichen Auswertungsroutinen durchführen. Wir haben keine zusätzliche unabhängige Bewertung dieser Produkte vorgenommen. Verarbeitete Variablen wurden auf Konsistenz mit den Quelldaten überprüft, um sicherzustellen, dass während der Datenübertragung oder räumlichen Mittelung keine Artefakte eingeführt wurden. Wir führen regelmäßige Überprüfungen hydrometeorologischer Zeitreihendaten ausgewählter Verwaltungseinheiten durch, um nach Inkonsistenzen oder Diskontinuitäten in den ERA5- oder NLDAS-Datensätzen zu suchen, da solche Fehler manchmal in operativen Erddatenprodukten auftreten können. Bisher haben wir keine problematischen Probleme festgestellt. Sollten diese jedoch auftreten, werden diese Daten als vorläufig gekennzeichnet, bis korrigierte Versionen der hydrometeorologischen Datendateien vom operativen Datenzentrum veröffentlicht werden.

Die Erreichbarkeit von Städten, validiert durch den Vergleich mit dem Netzwerkentfernungsalgorithmus in Google Maps, war ermutigend (R2 = 0,66; mittlere absolute Differenz 20,7 Minuten). Die in Tabelle 9 dargestellte Prävalenz komorbider Erkrankungen wurde aus Online-Quellen entnommen, die direkt oder in Verbindung mit seriösen Gesundheitsorganisationen, Gesundheitsforschungszentren, internationalen und nationalen Organisationen, Forschungszeitschriften und akademischen Institutionen stehen. Es wurden mehrere Validierungsprüfungen durchgeführt, um sicherzustellen, dass unser einheitlicher Datensatz mit diesen Eingabequellen übereinstimmt. Die Daten zur Pandemievorsorge stammen von ähnlich international anerkannten Forschungseinrichtungen und globalen Gesundheitsorganisationen. Es wurden mehrere Validierungsprüfungen durchgeführt, um die Konsistenz zwischen den einheitlichen Datensätzen und diesen streng geprüften Datenquellen sicherzustellen.

Einige US-Bezirke, Territorien und Inseln haben keine Standard-FIPS-Codes oder sind aus Standardeinheiten wie Bristol Bay plus Lake and Peninsula Borough, Dukes und Nantucket Countys, Utah-Gerichtsbarkeiten, Federal Correctional Institution (FCI), Veterans' Affairs usw. zusammengesetzt Michigan Department of Corrections (MDOC). Diese Einheiten erhalten eine eindeutige ID, die in der häufig aktualisierten Nachschlagetabelle auf GitHub aufgeführt ist.

Die Daten des Covid Tracking Project (CTP) wurden am 7. März 2021 nach einem Dienstjahr nicht mehr aktualisiert2. Alle anderen zeitvariablen Quellen werden derzeit täglich von den Originalquellen aktualisiert/synchronisiert.

Die täglich neuen Fälle für einige Einheiten fehlen möglicherweise oder sind negativ, wenn sie aus der Gesamtzahl der akkumulierten Fälle in den Rohdaten berechnet werden. Dies ist auf Meldeprobleme und Neuzuweisungen der Fälle zurückzuführen. Wir korrigieren und validieren die Dateneingaben nur, wenn wir stichhaltige Beweise dafür haben. Ansonsten behalten wir die Originaldaten genau so bei, wie sie aus offiziellen Quellen stammen. Zukünftig planen wir, auf allen Verwaltungsebenen eine erweiterte Version der globalen Daten bereitzustellen, die aus allen Datenquellen stammt. Dabei achten wir auf die Konsistenz zwischen den einheitlichen Daten und den Rohdaten.

Die kurze Lebensdauer von PM2,5 und NO2 und die räumlichen Heterogenitäten ihrer Emissionsquellen können je nach räumlicher Verteilung der Bevölkerung und Emissionsquellen innerhalb der Verwaltungseinheiten zeitweise zu erheblichen Unterschieden zwischen einfachen und bevölkerungsgewichteten Durchschnittswerten führen. Aufgrund der begrenzten Verfügbarkeit von Bodenmonitoren an einigen Standorten sind die NO2-Konzentrationen in städtischen Gebieten im Vergleich zu ländlichen Gebieten und in Nordamerika und Europa im Vergleich zu anderen Teilen der Welt sicherer44.

Die Daten zur Bevölkerung nach Geschlecht wurden als fehlende Werte für vierunddreißig subnationale Gebiete in Brasilien eingegeben, da die gemeldeten Werte nicht mit der Gesamtbevölkerung kompatibel waren. Die Zugänglichkeits-Rasterdatei deckte Monaco nicht ab und die Daten wurden manuell unter Verwendung von Werten in der Umgebung eingegeben. Wir schließen kleine, ausländische NUTS-Verwaltungsbezirke (z. B. Guadeloupe, Französisch-Guayana, Réunion) aus dem einheitlichen Datensatz aus, um die Rechenzeit zu verkürzen, die für die Aktualisierung des Datensatzes nahezu in Echtzeit erforderlich ist. Bemerkenswert ist, dass die Zugänglichkeits- und Bevölkerungsdaten aufgrund der operativen Definition der Daten für die Analyse auf subnationaler und nicht auf nationaler Ebene am relevantesten wären.

Wir behaupten, dass die Präsentation des darin enthaltenen Materials keinerlei Meinungsäußerung seitens der JHU zum rechtlichen Status eines Landes, Gebiets oder Territoriums oder seiner Behörden impliziert. Für die Darstellung und Verwendung von Grenzen, geografischen Namen und zugehörigen Daten, die auf Karten angezeigt und in Listen, Tabellen, Dokumenten und Datenbanken auf dieser Website enthalten sind, wird weder garantiert, dass sie fehlerfrei sind, noch implizieren sie notwendigerweise eine offizielle Billigung oder Akzeptanz durch JHU.

Die Daten werden in mehreren komprimierten Datenformaten gespeichert: RDS- und FST-Binärdatendateien, die von der R Statistical Software unterstützt werden, und CSV-Datendateien, die von allen anderen Tools für maschinelles Lernen unterstützt werden. Die R-Binärdatenformate bewahren effizient alle Variablentypen, Attribute und Objektklassen. Darüber hinaus sind RDS-Dateien stark komprimiert, was die Dateiübertragung und -speicherung erleichtert, während das FST-Format eine blitzschnelle Multithread-Datenserialisierung und vollständigen Direktzugriff auf gespeicherte Datensätze bietet, sodass ein Datenteilsatz (ausgewählte Spalten oder Zeilen) geladen werden kann, ohne die gesamten Daten lesen zu müssen Datei. Dies bietet einen Vorteil gegenüber anderen gängigen Datenformaten, wie z. B. durch Kommas getrennten Werten (CSV) oder deren komprimierten Versionen, die die Variablentypen nicht explizit angeben (z. B. Ganzzahl vs. Doppel). Darüber hinaus sind die erzeugten Dateien viel kleiner, was den Datenzugriff und die Datenverarbeitung erleichtert.

Der Quellcode, der zum Bereinigen, Vereinheitlichen, Aggregieren und Zusammenführen der verschiedenen Datenkomponenten aus allen Quellen verwendet wird, wird auf GitHub unter https://github.com/CSSEGISandData/COVID-19_Unified-Dataset verfügbar sein.

Dong, E., Du, H. & Gardner, L. Ein interaktives webbasiertes Dashboard zur Verfolgung von COVID-19 in Echtzeit. Lanzetteninfektion. Dis. 20, 533–534 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Die Atlantic Monthly Group. Das COVID-Tracking-Projekt. Das COVID-Tracking-Projekt https://covidtracking.com/ (2023).

New Yorker Ministerium für Gesundheit und psychische Hygiene. Daten zur NYC-Coronavirus-Krankheit 2019 (COVID-19). (2023).

Die New York Times. Daten zum Coronavirus (Covid-19) in den Vereinigten Staaten (archiviert). (2023).

Cota, W. Überwachung der Zahl der COVID-19-Fälle und Todesfälle in Brasilien auf kommunaler und föderaler Ebene. https://preprints.scielo.org/index.php/scielo/preprint/view/362/version/371, https://doi.org/10.1590/SciELOPreprints.362 (2020).

Italienische Katastrophenschutzbehörde. Früher COVID-19 Italien. (2023).

Robert Koch-Institut. COVID-19 Datenhub. COVID-19 Datenhub https://npgeo-corona-npgeo-de.hub.arcgis.com/.

Gemeinsame Forschungsstelle. Begründung der GFS-COVID-19-Website – Datenüberwachung und nationale Maßnahmen. (2023).

Europäisches Zentrum für die Prävention und Kontrolle von Krankheiten. COVID 19. https://www.ecdc.europa.eu/en/covid-19 (2021).

Weltgesundheitsorganisation. WHO-Coronavirus (COVID-19)-Dashboard. https://covid19.who.int (2023).

Zentren für Krankheitskontrolle und Prävention. COVID-Daten-Tracker. Zentren für die Kontrolle und Prävention von Krankheiten https://covid.cdc.gov/covid-data-tracker (2020).

Xu, B. et al. Epidemiologische Daten zum COVID-19-Ausbruch, Fallinformationen in Echtzeit. Wissenschaft. Daten 7, 106 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Institut für Gesundheitsmetriken und -bewertung. Tägliche und kumulative SARS-CoV-2-Infektionsschätzungen 2019–2021. Tägliche und kumulative SARS-CoV-2-Infektionsschätzungen 2019–2021 https://ghdx.healthdata.org/record/ihme-data/covid_19_cumulative_infections (2021).

Cori, A., Ferguson, NM, Fraser, C. & Cauchemez, S. Ein neues Framework und eine neue Software zur Schätzung zeitlich variierender Reproduktionszahlen während Epidemien. Bin. J. Epidemiol. 178, 1505–1512 (2013).

Artikel PubMed Google Scholar

Colston, JM et al. Auswirkungen hydrometeorologischer und anderer Faktoren auf die Reproduktionszahl von SARS-CoV-2 in drei angrenzenden Ländern im tropischen Anden-Südamerika: eine räumlich-zeitlich disaggregierte Zeitreihenanalyse. IJID-Reg. 6, 29–41 (2023).

Artikel PubMed Google Scholar

Beesley, LJ et al. Mehrdimensionale Resilienz: Eine quantitative Untersuchung der Krankheitsfolgen sowie der wirtschaftlichen, politischen und sozialen Resilienz gegenüber der COVID-19-Pandemie in sechs Ländern. PLOS ONE 18, e0279894 (2023).

Artikel CAS PubMed PubMed Central Google Scholar

Du, H. et al. Einbeziehung von Daten zu Variantenhäufigkeiten in kurzfristige Prognosen für COVID-19-Fälle und Todesfälle in den USA: ein Deep-Learning-Ansatz. eBioMedicine 89, 104482 (2023).

Artikel PubMed PubMed Central Google Scholar

Cheam, A., Fredette, M., Marbac, M. & Navarro, F. Translationsinvariantes funktionelles Clustering bei COVID-19-Todesfällen, angepasst an Bevölkerungsrisikofaktoren. JR-Stat. Soc. Ser. C Appl. Stat. qlad014, https://doi.org/10.1093/jrsssc/qlad014 (2023).

Kerr, GH et al. Sich entwickelnde Treiber der brasilianischen SARS-CoV-2-Übertragung: Eine räumlich-zeitlich disaggregierte Zeitreihenanalyse von Meteorologie, Politik und menschlicher Mobilität. GeoHealth 7, e2022GH000727 (2023).

Artikel PubMed PubMed Central Google Scholar

Wilkinson, MD et al. Die FAIR-Leitprinzipien für wissenschaftliches Datenmanagement und -verantwortung. Wissenschaft. Daten 3, 160018 (2016).

Artikel PubMed PubMed Central Google Scholar

Badr, HS et al. COVID-19 Unified Dataset v1.0. Zenodo https://doi.org/10.5281/zenodo.7789960 (2023).

Abbott, S. et al. EpiNow2: Schätzen Sie Echtzeit-Fallzahlen und zeitlich variierende epidemiologische Parameter. (2020).

Abbott, S. et al. Schätzung der zeitlich variierenden Reproduktionszahl von SARS-CoV-2 anhand nationaler und subnationaler Fallzahlen. Willkommen, Open Res. 5, 112 (2020).

Artikel Google Scholar

Alene, M. et al. Serienintervall und Inkubationszeit von COVID-19: eine systematische Überprüfung und Metaanalyse. BMC-Infektion. Dis. 21, 257 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

McAloon, C. et al. Inkubationszeit von COVID-19: eine schnelle systematische Überprüfung und Metaanalyse der Beobachtungsforschung. BMJ Open 10, e039652 (2020).

Artikel PubMed PubMed Central Google Scholar

Lauer, SA et al. Die Inkubationszeit der Coronavirus-Krankheit 2019 (COVID-19) aus öffentlich gemeldeten bestätigten Fällen: Schätzung und Anwendung. Ann. Praktikant. Med. 172, 577–582 (2020).

Artikel PubMed Google Scholar

Rai, B., Shukla, A. & Dwivedi, LK Schätzungen serieller Intervalle für COVID-19: Eine systematische Überprüfung und Metaanalyse. Klin. Epidemiol. Globus. Gesundheit 9, 157–161 (2021).

Artikel CAS PubMed Google Scholar

Ganyani, T. et al. Schätzung des Generationsintervalls für die Coronavirus-Krankheit (COVID-19) basierend auf Daten zum Symptombeginn, März 2020. Eurosurveillance 25 (2020).

Johns Hopkins Centers for Civic Impact. Bloomberg Center for Government Excellence. GitHub https://github.com/govex.

Sera, F. et al. Eine Querschnittsanalyse meteorologischer Faktoren und der SARS-CoV-2-Übertragung in 409 Städten in 26 Ländern. Nat. Komm. 12, 5968 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Fontal, A. et al. Klimasignaturen in den verschiedenen COVID-19-Pandemiewellen auf beiden Hemisphären. Nat. Berechnen. Wissenschaft. 1, 655–665 (2021).

Artikel Google Scholar

Pan, WK et al. Heterogenität in der Wirksamkeit nichtpharmazeutischer Interventionen während der ersten SARS-CoV2-Welle in den Vereinigten Staaten. Vorderseite. Öffentliche Gesundheit 9, 754696 (2021).

Artikel PubMed PubMed Central Google Scholar

Ma, Y., Pei, S., Shaman, J., Dubrow, R. & Chen, K. Rolle meteorologischer Faktoren bei der Übertragung von SARS-CoV-2 in den Vereinigten Staaten. Nat. Komm. 12, 3602 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Kerr, GH, Badr, HS, Gardner, LM, Perez-Saez, J. & Zaitchik, BF Zusammenhänge zwischen Meteorologie und COVID-19 in frühen Studien: Inkonsistenzen, Unsicherheiten und Empfehlungen. One Health 12, 100225 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Zentrum für internationales geowissenschaftliches Informationsnetzwerk – CIESIN – Columbia University. Gerasterte Weltbevölkerung, Version 4 (GPWv4): Bevölkerungszahl angepasst an die Revision der UN-WPP-Ländergesamtzahlen von 2015, Revision 11. (2018).

Xia, Y. et al. Analyse und Validierung des Wasser- und Energieflusses im kontinentalen Maßstab für die Projektphase 2 des North American Land Data Assimilation System (NLDAS-2): 1. Vergleich und Anwendung von Modellprodukten: WASSER- UND ENERGIEFLUSSANALYSE. J. Geophys. Res. Atmosphären 117, n/a/a (2012).

Google Scholar

Hersbach, H. et al. Die globale ERA5-Reanalyse. QJR Meteorol. Soc. 146, 1999–2049 (2020).

Artikel ADS Google Scholar

Tarek, M., Brissette, FP & Arsenault, R. Auswertung der ERA5-Reanalyse als potenzieller Referenzdatensatz für die hydrologische Modellierung in Nordamerika. Hydrol. Erdsystem. Wissenschaft. 24, 2527–2544 (2020).

Artikel ADS Google Scholar

Liang, D. et al. Städtische Luftverschmutzung kann die Sterblichkeits- und Sterblichkeitsrate bei COVID-19 in den Vereinigten Staaten erhöhen. Die Innovation 1, 100047 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Wu, X., Nethery, RC, Sabath, MB, Braun, D. & Dominici, F. Luftverschmutzung und COVID-19-Mortalität in den Vereinigten Staaten: Stärken und Grenzen einer ökologischen Regressionsanalyse. Wissenschaft. Adv. 6, eabd4049 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Pozzer, A. et al. Regionale und globale Beiträge der Luftverschmutzung zum Sterberisiko durch COVID-19. Herz-Kreislauf. Res. 116, 2247–2253 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Hammer, MS et al. Globale Schätzungen und langfristige Trends der Feinstaubkonzentrationen (1998–2018). Umgebung. Wissenschaft. Technol. 54, 7879–7890 (2020).

Artikel ADS CAS PubMed Google Scholar

Larkin, A. et al. Globales Landnutzungs-Regressionsmodell für Stickstoffdioxid-Luftverschmutzung. Umgebung. Wissenschaft. Technol. 51, 6957–6964 (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Anenberg, SC et al. Langfristige Trends der städtischen NO2-Konzentrationen und der damit verbundenen Inzidenz von Asthma bei Kindern: Schätzungen aus globalen Datensätzen. Lancet Planet. Gesundheit 6, e49–e58 (2022).

Artikel PubMed Google Scholar

Anenberg, S. Jährliche Durchschnittskonzentrationen von Stickstoffdioxid auf Oberflächenebene V1 (SFC_NITROGEN_DIOXIDE_CONC). (2023).

Hale, T. et al. Eine globale Panel-Datenbank zu Pandemierichtlinien (Oxford COVID-19 Government Response Tracker). Nat. Summen. Verhalten. 5, 529–538 (2021).

Artikel PubMed Google Scholar

Zentren für Krankheitskontrolle und Prävention. Menschen mit bestimmten Erkrankungen. Zentren für die Kontrolle und Prävention von Krankheiten https://www.cdc.gov/coronavirus/2019-ncov/need-extra-precautions/people-with-medical-conditions.html (2023).

Clark, A. et al. Globale, regionale und nationale Schätzungen der Bevölkerung mit einem erhöhten Risiko für schweres COVID-19 aufgrund zugrunde liegender Gesundheitszustände im Jahr 2020: eine Modellstudie. Lancet Glob. Gesundheit 8, e1003–e1017 (2020).

Artikel PubMed PubMed Central Google Scholar

Die Weltbank. Diabetes-Prävalenz (% der Bevölkerung im Alter von 20 bis 79 Jahren). https://data.worldbank.org/indicator/SH.STA.DIAB.ZS?name_desc=false.

Robert Wood Johnson Stiftung. Diabetes. Stand der Fettleibigkeit bei Kindern https://stateofchildhoodobesity.org/demographic-data/adult/ (2023).

Weltgesundheitsorganisation. Prävalenz von Adipositas bei Erwachsenen, BMI ≥ 30, altersstandardisiert. Schätzungen nach Ländern. Datenrepository des Global Health Observatory https://apps.who.int/gho/data/view.main.CTRY2450A.

Robert Wood Johnson Stiftung. Fettleibigkeitsraten bei Erwachsenen. Stand der Fettleibigkeit bei Kindern https://stateofchildhoodobesity.org/demographic-data/adult/.

CIA. Fettleibigkeit – Prävalenzrate bei Erwachsenen. Das World Factbook https://www.cia.gov/the-world-factbook/field/obesity-adult-prevalence-rate/.

Weltgesundheitsorganisation. Prävalenz des aktuellen Tabakkonsums. Daten nach Ländern. Datenrepository des Global Health Observatory https://apps.who.int/gho/data/view.main.GSWCAH20v.

System zur Überwachung verhaltensbezogener Risikofaktoren. BRFSS-Prävalenz- und Trenddaten: Raucherprävalenz. https://nccd.cdc.gov/BRFSSPrevalence/rdPage.aspx?rdReport=DPH_BRFSS.ExploreByTopic&irbLocationType=StatesAndMMSA&islClass=CLASS17&islTopic=TOPIC15&islYear=2018&rdRnd=77675.

Institut für Gesundheitsmetriken und -bewertung. GBD-Ergebnistool. GBD-Ergebnistool https://vizhub.healthdata.org/gbd-results (2023).

Robert Wood Johnson Stiftung. Bluthochdruck in den Vereinigten Staaten. Stand der Fettleibigkeit bei Kindern https://stateofchildhoodobesity.org/demographic-data/adult/ (2023).

Zusammenarbeit bei NCD-Risikofaktoren. Blutdruck: Entwicklung des Blutdrucks im Laufe der Zeit. https://ncdrisc.org/data-downloads-blood-pression.html (2017).

Ramshaw, RE et al. Eine Datenbank mit geopositionierten Vorkommen des Middle East Respiratory Syndrome Coronavirus. Wissenschaft. Daten 6, 318 (2019).

Artikel PubMed PubMed Central Google Scholar

Weltgesundheitsorganisation. Schweres akutes respiratorisches Syndrom (SARS). https://www.who.int/health-topics/severe-acute-respiratory-syndrome (2022).

Malaria-Atlas-Projekt. Zugänglichkeit zu Städten. https://malariaatlas.org/.

Weiss, DJ et al. Eine globale Karte der Reisezeiten zu Städten zur Bewertung von Ungleichheiten bei der Erreichbarkeit im Jahr 2015. Nature 553, 333–336 (2018).

Artikel ADS CAS PubMed Google Scholar

Weiss, DJ et al. Globale Karten der Reisezeit zu Gesundheitseinrichtungen. Nat. Med. 26, 1835–1838 (2020).

Artikel CAS PubMed Google Scholar

Carrasco-Escobar, G., Manrique, E., Tello-Lizarraga, K. & Miranda, JJ Reisezeit zu Gesundheitseinrichtungen als Indikator für die geografische Erreichbarkeit in der heterogenen Landbedeckung in Peru. Vorderseite. Öffentliche Gesundheit 8, 498 (2020).

Artikel PubMed PubMed Central Google Scholar

Hu, Y., Wang, C., Li, R. & Wang, F. Schätzung einer großen Fahrzeitmatrix zwischen Postleitzahlen in den Vereinigten Staaten: Ein differenzierter Stichprobenansatz. J. Transp. Geogr. 86, 102770 (2020).

Artikel PubMed PubMed Central Google Scholar

Tatem, AJ WorldPop, offene Daten für räumliche Demographie. Wissenschaft. Daten 4, 170004 (2017).

Artikel PubMed PubMed Central Google Scholar

Referenzen herunterladen

Diese Arbeit wird durch das NASA Health & Air Quality-Projekt 80NSSC18K0327 im Rahmen einer COVID-19-Ergänzung, das National Institute of Health (NIH)-Projekt 3U19AI135995-03S1 („Consortium for Viral Systems Biology (CViSB)“; Zusammenarbeit mit dem Scripps Research Institute und unterstützt UCLA) und NASA gewähren 80NSSC20K1122. Das Johns Hopkins Applied Physics Laboratory (APL), Data Services und Esri bieten professionelle Unterstützung beim Entwurf der automatischen Datenerfassungsstruktur und bei der Pflege des JHU CSSE GitHub-Repositorys.

Arash Mohegh

Aktuelle Adresse: Health & Exposure Assessment Branch, California Air Resources Board, Sacramento, CA, 95812, USA

Abteilung für Bau- und Systemtechnik, Johns Hopkins University, Baltimore, MD, 21218, USA

Hamada S. Badr, Ensheng Dong, Hongru Du, Maximilian Marshall, Kristen Nixon und Lauren M. Gardner

Abteilung für Erd- und Planetenwissenschaften, Johns Hopkins University, Baltimore, MD, 21218, USA

Hamada S. Badr & Benjamin F. Zaitchik

Abteilung für Umwelt- und Arbeitsgesundheit, Milken Institute School of Public Health, George Washington University, Washington, DC, 20052, USA

Gaige H. Kerr, Arash Mohegh, Daniel L. Goldberg und Susan C. Anenberg

College of Arts and Sciences, University of Virginia, Charlottesville, VA, 22903, USA

Nhat-Lan H. Nguyen & Patrick Hinson

Abteilung für Infektionskrankheiten und internationale Gesundheit, University of Virginia School of Medicine, Charlottesville, VA, 22903, USA

Yen-Ting Chen, Patrick Hinson, Josh M. Colston und Margaret N. Kosek

Abteilung für Notfallmedizin, Chi-Mei Medical Center, Tainan, Taiwan

Yen-Ting Chen

Sie können diesen Autor auch in PubMed Google Scholar suchen

BFZ und LMG konzipierten und überwachten die Datenerhebung und Qualitätskontrolle. HSB erstellte den einheitlichen Datensatz, standardisierte die Verwaltungsnamen und Codes nach Geodaten-ID, harmonisierte die Variablennamen und -typen, führte alle Datenkomponenten zusammen, entwickelte den Hauptcode und pflegt die Datenstruktur und Echtzeitaktualisierungen. BFZ und GHK verarbeiteten und pflegten die hydrometeorologischen und Luftqualitätsdaten. Alle Autoren trugen zum Datensatzbestand sowie zum Verfassen und Bearbeiten des Manuskripts bei.

Korrespondenz mit Benjamin F. Zaitchik.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Badr, HS, Zaitchik, BF, Kerr, GH et al. Einheitliche umweltepidemiologische Echtzeitdaten zur mehrskaligen Modellierung der COVID-19-Pandemie. Sci Data 10, 367 (2023). https://doi.org/10.1038/s41597-023-02276-y

Zitat herunterladen

Eingegangen: 06. Mai 2022

Angenommen: 30. Mai 2023

Veröffentlicht: 07. Juni 2023

DOI: https://doi.org/10.1038/s41597-023-02276-y

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Nachricht