Nejužitečnější API s daty o COVID-19
Vše v jednom, historická a krajská data🔗
- Historická data: počty případů, počty testů, počty smrtí, hospitalizace, karantény, reprodukční číslo.
- Vývoj v krajích: karantény, úmrtí, případy dle okresů (detailnější, neboť MZČR publikuje pouze kraje).
Odkaz na API ~ nebo zkopírujte níže 📋
Více informací: zdroj dat, schéma dat, zdrojový kód
Zdroj dat
- MZČR
- ČSSZ
- Czech R0 Estimate, autoři: Jan Netík, Honza Řasa, Jan Schubert
- COVID-19 po okresech z KHS, autor: Marek Lutonský
Aktuální velikost dat
Schéma dat
Schedule
Každých 8 hodin
Zdrojový kód
Zdrojové kódy k nalezení na: github.com/h0n24/covid-czech-historical-data
Další API s daty o COVID-19
Nákaza v jednotlivých okresech podle krajských hygienických stanic🔗
Odkaz na API ~ nebo zkopírujte níže 📋
Více informací: zdroj dat, schéma dat
Zdroj dat
Zdrojem dat je Google Tabulka COVID-19 po okresech, KHS, kterou a spravuje Marek Lutonský, část dat je aktualizována pomocí crawleru Vladimíra Smitky a dalších (také jsem částí kódu přispěl :)).
Aktuální velikost dat
Schéma dat
Pozor! Data jsou oproti API se všemi daty, viz výše, řazena chronologicky, podle jednotlivých dnů. To je snazší na programové procházení, ale velikost zdrojových dat API může být větší než u verze výše.
Schéma dat
Přehled osob dle krajských hygienických stanic🔗
Odkaz na API ~ nebo zkopírujte níže 📋
Více informací: zdroj dat, schéma dat, motivace, zdrojový kód
Zdroj dat
Zdrojem dat je Přehled osob s prokázanou nákazou dle hlášení krajských hygienických stanic
Proč vznik další API? Problém s původní.
Velikost
API od ministerstva je zbytečně velká (Aktuálně: vs ), protože spousta dat se opakuje (měřeno pro minifikovanou druhou verzi, u první je rozdíl dat více než 30×). To může být časem, u většího počtu identifikovaných osob, značný problém.
Nečitelná data
Dalším problémem je fakt, že některá data jsou uchována v lidmi nečitelném formátu.
- Identifikátor kraje je formátován podle klasifikace NUTS 3, ve kterém byla pozitivní nákaza hlášena krajskou hygienickou stanicí.
- Identifikátor státu v zahraničí, kde došlo k nákaze je dvoumístný kód z číselníku zemí CZEM.
I přes tyto zkratky jsou zdrojová data mnohem větší (https://onemocneni-aktualne.mzcr.cz/api/v1/covid-19/osoby.json) než tato API.
Schéma dat
Ukázka dat
Schéma API
klíč | vysvětlivka |
---|---|
data | Viz níže – schéma dat |
lastUpdatedAtSource | Poslední update v původní api. |
lastUpdatedAtApify | Poslední update v API od Apify. |
Schéma dat
den záznamu | data ke dni pro každou osobu ve formátu: [věk, pohlaví, místo nákazy, kraj] |
---|---|
2020-02-29 | [25,"žena","Itálie","Ústecký kraj"], [49,"žena","Spojené státy","Hlavní město Praha"], [11,"žena","Česko","Ústecký kraj"] … |
Schedule
Každých 30 minut
Zdrojový kód
Vývoj reprodukčního čísla v ČR🔗
Odkaz na API ~ nebo zkopírujte níže 📋
Více informací: zdroj dat, schéma dat, motivace, zdrojový kód
Zdroj dat
Zdrojem dat je Google Tabulka COVID-19 Reproduction number estimate, kterou vytvořil tým lidí okolo Data Proti Covid, konkrétně Honza Řasa, Jan Schubert a Jan Netík. R0 se počítá z posledního týdne, více viz jednotlivá data. Zdrojové kódy lze nalézt na Githubu.
Aktuální velikost dat
Schéma dat
Ukázka dat
Schéma API
klíč | vysvětlivka |
---|---|
data | Viz níže – schéma dat |
lastUpdatedAtSource | Poslední update v původní tabulce. |
lastUpdatedAtApify | Poslední update v API od Apify. |
Schéma dat
Ukázka dat: ["2020-03-16",2.3,2.5,2.8]
Vysvětlivky
date Den pro který je R0 vypočítáno |
CI_low Spodní mez R0/7 |
R0_last7 Hodnota R0 za poslední týden |
CI_high Horní mez R0/7 |
---|---|---|---|
"2020-03-16" | 2.3 | 2.5 | 2.8 |