Meglepő adatokkal szolgál a koronavírus-járványról a big data
A koronavírus-járvány halálgörbéjére sokkal nagyobb hatással van a páciensek kora, mint azt korábban gondolták. Ugyanakkor néhány társuló betegség könnyedén 20-30 százalékra növelheti a kórházba kerülés lehetőségét a harmincas, sőt akár a húszas korosztálynál is. Egyebek mellett ezekre derített fényt a The Economist által kifejlesztett kockázatértékelő alkalmazás.
Már a koronavírus-járvány legelején nyilvánvalóvá vált, hogy az idősebbek és a különböző krónikus betegségekben szenvedők nagyobb veszélynek vannak kitéve, ha megfertőződnek a SARS-CoV-2 vírussal. Ugyanakkor nem volt világos, hogy miként függnek össze a különböző kockázati tényezők, illetve milyen mértékben csökkentik/növelik a különböző „társult betegségek” a koronavírussal megfertőzött egyének túlélési esélyeit. A The Economist informatikusai kifejlesztettek egy eszközt, amely a big data segítségével megpróbál válaszolni ezekre a kérdésekre.
Honnan vannak az adatok?
Röviddel a világjárvány kitörése után, 2020 áprilisában amerikai egészségügyi intézmények létrehoztak egy adatbázist (Covid-19 Research Database), hogy lehetővé tegyék közhasznú szervezetek számára az új pandémia kutatását. Az azóta is folyamatosan gyarapodó adatbázis mintegy ötmilliárd egyéni orvosi adatot tartalmaz közel 250 millió páciensről – lényegében az Egyesült Államok teljes felnőtt korú lakosságáról.
A rendkívüli biztonsági intézkedésekkel védett és csak kevesek számára hozzáférhetővé tett orvosi adatokat a szociológiai felméréseknél is használt mintavételezési eljárással "finomították", hogy kiszűrjék a statisztikai hibákat. (Akit érdekel, itt olvashat részletesebben az eljárásról.)
A mintegy 250 millió páciens közül így kiválasztottak 425 ezer személyt, akit 2020 májusa és decembere között koronavírus-fertőzéssel diagnosztizáltak. Az anonimizált adatsorok tartalmazzák a korra, nemre és társuló betegségekre (komorbiditás) vonatkozó információkat, illetve hogy az adott személy kórházi kezelésre szorult vagy elhunyt a betegség következtében.
Hogyan működik?
Az economist.com/covidrisk oldalon elérhető statisztikai modell azt mutatja, hogy a kor, nem és 29 különféle betegség kombinációja az esetek hány százalékában vezetett a Covid-19 súlyosabb formáinak kialakulásához vagy halálhoz a fertőzés diagnosztizálását követő harminc napon belül.
Az interaktív modell csakis a megadott betegségeket veszi figyelembe a számításnál, noha a valóságban azok a legtöbb esetben együtt járnak valamilyen más bántalommal. Például a 2-es típusú diabéteszben szenvedők igen gyakran magas vérnyomással is küzdenek.
Az eredmények a fejlesztőket is meglepték
Már a járvány meglehetősen korai szakaszában kiderült, hogy egy idős, beteg ember nagyobb veszélynek van kitéve, mint egy fiatal és egészséges, illetve nagyobb az esélye, hogy egy férfi kórházba kerül vagy meghal, mint egy nő. Ugyanakkor az alkalmazás fejlesztőit is meglepte, hogy például a halálgörbére sokkal nagyobb hatással van a páciensek kora, mint a különböző társuló betegségek. Más szóval a beteg fiatalnak nagyobb az esélye túlélni a Covid-19-et, mint egy idősnek, még ha egyébként egészséges is.
Ezzel szemben a komorbiditások meglepően fontos kockázati tényezők a betegség súlyosabb formáinak kialakulását illetően. Néhány társuló betegség könnyedén 20-30 százalékra növelheti a kórházba kerülés valószínűségét a harmincas, sőt akár a húszas korosztálynál is.
CSAK SAJÁT
A 25 éves asztmás, túlsúlyos és 2-es típusú diabéteszes férfiak 30 százaléka kórházba került a koronavírus-fertőzés következtében, bár kevesebb mint 0,1 százalékuk vesztette életét. (Mint fentebb is jeleztük, egy beteg fiatalnak nagyobb esélye van a gyógyulásra, mint egy egészséges idősnek.) Érdekes továbbá, hogy az említett kombináció a nőknél 50 százalékkal kisebb arányban vezetett a Covid-19 súlyos formáinak kialakulásához.
A nők és férfiak közötti különbségek amúgy a korral együtt nőnek. Miközben egy 25 éves egészséges férfinak "mindössze" hatvan százalékkal több esélye van kórházba kerülni fertőzés esetén, mint egy hasonló korú nőnek, az elhalálozás kockázata pedig hasonló mértékű a két nemnél, addig 50 éves korra a súlyos megbetegedés és az elhalálozás kockázata is kétszer nagyobb a férfiak esetében.
Ugyancsak meglepő, hogy a légzőszervi betegségek – például az asztma vagy a krónikus légzési elégtelenség – kevésbé számítanak kockázati tényezőnek, mint a szív- és keringési panaszok, a vese- és májbetegségek, vagy a diabétesz.
A modellezés korlátai
Az Economist Covid-19 kockázatértékelője csak elvileg képes "megjósolni" a látogató neme, kora és idült betegségei alapján, hogy mekkora esélye van túlélni a Covid-19 nevű betegséget, amelyet a SARS-CoV-2 vírus okoz. Azért csak elvileg, mert a használt statisztikai modell csoportokra vonatkozó számításokat végez, vagyis a kapott eredmények átlagok, amelyektől az adott csoporthoz tartozó egyének kockázata eltérhet. Az alkalmazás fejlesztői figyelmeztetnek is: az eredményeket semmiképpen sem szabad személyes kockázatértékelésként kezelni; akinek orvosra van szüksége, az forduljon orvoshoz!
Az adatbázisnak magának is vannak korlátai. Például nem szerepelnek benne olyanok, akik – nem lévén egészségbiztosításuk – nem kórházban szenvedtek vagy hunytak el. Ugyanakkor a 80 év fölöttiek gyakran csak 80+ jelöléssel kerültek be a nyilvántartásba, a pontos életkorukat nem rögzítették. Következésképp a 80 éven fölöttiekre vonatkozó számítások megbízhatósága csökken.
A komorbiditások esetében az utóbbi hét év nyilvántartását vették figyelembe, és az adatok nem utalnak egy-egy páciens éppen aktuális állapotára. Másfelől az ismert betegségek nélküli páciensek sem mind feltétlenül egészségesek, illetve a 29 leggyakoribb komorbiditáson kívül más, kockázati tényezőnek számító bántalmakban is szenvedhetnek.