ISSN 1804-6371
 
 

Zdrojová data a metodika predikce 2019

I. Zdroje dat

Predikce využívají pouze validní populační data, oficiálně získaná od zákonem určených správců (Ústav zdravotnických informací a statistiky ČR, Český statistický úřad). Data jsou analyzována v anonymizované podobě, tedy bez přímých nebo nepřímých identifikátorů konkrétního pacienta. Konkrétně jde o následující zdroje:

Zdroje demografických populačních dat

Jako součást monitoringu vývoje české populace zpracovává národní statistický úřad (Český statistický úřad – ČSÚ) data o demografické struktuře obyvatelstva ČR, které jsou k dispozici na webových stránkách ČSÚ (https://czso.cz/csu/czso/obyvatelstvo_lide). Tato data postihují hlavní demografické charakteristiky české populace, zejména celkový počet obyvatel, detailní věkovou strukturu, charakteristiky očekávané délky života i např. projekci vývoje věkové struktury obyvatelstva ČR až do roku 2050.

Zdrojem údajů o populační mortalitě zhoubných novotvarů v České republice je primárně databáze příčin úmrtí, kterou taktéž zpracovává Český statistický úřad dle mezinárodních metodik na základě údajů z listu o prohlídce mrtvého (klasifikace MKN-10). Zemřelému je určena jedna hlavní příčina úmrtí, na základě které jsou zpracovávány oficiální statistické výstupy jednotlivých zemí o populační mortalitě dle příčin úmrtí. Tyto statistiky jsou k dispozici jednak ve výstupech národních statistických úřadů a dále v mezinárodních databázích Evropské komise - Eurostatu (oficiální evropská statistika) a Světové zdravotnické organizace.

Národní onkologický registr ČR (NOR)

Registrace novotvarů je v České republice legislativně zakotvena a je povinná. V České republice je správcem Národního onkologického registru Ústav zdravotnických informací a statistiky (ÚZIS ČR). Garantuje metodickou a obsahovou jednotu registru. Odpovídá za stav databáze, provádění kontrol správnosti dat, distribuci metodiky, zpracování a poskytování statistických výstupů a jejich zveřejňování, určuje přístupová práva oprávněných uživatelů. Poradním orgánem a odborným garantem NOR je Rada NOR. Jejími členy jsou zpravidla zástupci ÚZIS ČR, regionálních (územních) center NOR, KSRZIS, zástupci MZ ČR a zástupci České onkologické společnosti ČLS JEP.

V dnešní době je NOR nedílnou součástí komplexní onkologické péče a jako celoplošný registr s reprezentativním pokrytím 100 % české populace obsahuje za období 1976-2016 více než 2,4 milionu záznamů. Tedy již od roku 1976 má ČR k dispozici evidenci jednotlivých osob s diagnostikovaným novotvarem na základě rodného čísla včetně následného sledování každého pacienta prostřednictvím kontrolního hlášení. Široké veřejnosti jsou data NOR zpřístupněná v omezené a agregované podobě na webovém portálu projektu SVOD (Systém pro Vizualizaci Onkologických Dat), www.svod.cz. Projekt SVOD je zaměřen na interaktivní popisné analýzy umožňující uživateli přímo zkoumat epidemiologické trendy jím vybraných onkologických diagnóz a automatizované připravené prezentace zpracovávající některá významná témata.

Panel expertů ČOS ČLS JEP

Některé informace používané zejména v populačním modelování počtu onkologických pacientů a také v hodnocení výsledků a nákladů léčebné péče nelze získat z dostupných populačních zdrojů ani z publikovaných klinických studií. Jako příklad můžeme uvést časový vývoj pravděpodobnosti relapsu/progrese primárního nádorového onemocnění u různých klinických stadií, pravděpodobnost nasazení vyšších linií protinádorové terapie u různě zatížených pacientů apod. V tomto případě jsou pro predikce a odhady využívány odborné posudky a odhady expertní skupiny ČOS. Data jsou získávána formou autorizovaných elektronických formulářů nebo v tištěné podobě. Panel expertů zpracovává tyto podklady na základě jasně formulovaných a datově podložených otázek. Členové panelu vypracovávají podklady individuálně, bez vzájemných konzultací.

Jedním z velmi cenných vstupů panelu expertů do celého systému monitoringu nákladné péče je tzv. klinická korekce populačních odhadů. Ne všichni nově příchozí pacienti mohou být léčeni protinádorovou terapií. Jejímu podání může bránit pokročilý věk nemocného, jeho celkový zdravotní stav nebo pokročilost nádorového onemocnění. Panel expertů koriguje, a tedy snižuje, populační odhady počtu pacientů právě s ohledem na tyto skutečnosti.

 

II. Metodika prediktivního hodnocení epidemiologie ČR

 Definice referenčního souboru dat pro klinicky relevantní predikce onkologické zátěže

 Korektní definice referenčních dat je základem věrohodnosti analýz, což je zvláště významné u prediktivních modelů. Chceme-li populační data využít pro hodnocení výsledků a nákladů péče, musíme z dostupných zdrojů čerpat údaje s jistým omezením:

  • Data musí být aktuální a musí reflektovat současnou situaci ve zdravotnictví. Historické trendy mohou být velmi zavádějící.
  • Zásadní jsou údaje od pacientů, kteří skutečně prošli zdravotnickým zařízením a byli léčeni. Počty pacientů diagnostikovaných např. při pitvě sice mají epidemiologický význam, ale hodnocení nákladů a výsledků péče nijak neovlivňují.

Této analýze jsme podrobili Národní onkologický registr ČR (NOR). Z důvodu aktuálnosti jsme rozsah analyzovaných dat omezili na období 1995–2016, kdy v databázi NOR můžeme pracovat s validními záznamy podle novějších verzí klasifikace TNM. Data z tohoto období představují dostatečně velký vzorek pro populační analýzy (Obrázek 1). Velmi podstatné je vyčlenění záznamů o pacientech s nedokončenou diagnostikou v důsledku odmítnutí léčby, komplikací nebo časného úmrtí, neboť tyto záznamy by zkreslovaly analýzy o nákladech na protinádorovou terapii. Ve shodě s literaturou byla použita hranice časného úmrtí do 1 měsíce od diagnózy.

Výsledkem auditu dostupných populačních dat je tedy referenční soubor kvalitních a věrohodných záznamů, které zachycují léčbu a výsledky léčby u pacientů s řádně dokončenou diagnostikou. Jak dokumentuje Obr. 1, i následná selekce protinádorově léčených a neléčených pacientů ještě stále poskytuje dostatečně velký vzorek pro populační analýzy.

Obrázek 1. Navržená cesta k referenčnímu souboru populačních dat pro predikce onkologické zátěže (Národní onkologický registr ČR, 1995–2016)

Stručný metodický popis provedených výpočtů

Cílem prediktivních modelů je dospět ke spolehlivému odhadu počtu pacientů žijících v daném období a vyžadujících protinádorovou terapii (Obrázek 2). Podle podílu klinických stadií u žijících pacientů lze následně při znalosti možných scénářů léčby odhadnout i očekávané náklady. Jelikož u populačních registrů dostáváme data vždy s jistým zpožděním, je nutné níže uvedené odhady provádět prospektivně:

  1. Predikce incidence onemocnění. Odhady byly provedeny odděleně pro klinická stadia a v relevantní stratifikaci dle věkových skupin. Metodika vychází z trendů zátěže populace zhoubnými nádory za známé období a koriguje je s ohledem na demografické projekce v blízké budoucnosti. Byl použit Poissonův regresní model s odhady doplněnými intervaly spolehlivosti (predikčními intervaly). Vedle extrapolace regresním modelem byla v případě diagnóz s nespecifickým epidemiologickým trendem zvažována extrapolace střední hodnoty zátěže v recentním období.
  2. Odhad prevalence pacientů. Výpočet kombinuje odhady počtu nově diagnostikovaných pacientů v budoucích letech a pravděpodobnost x-letého přežití u pacientů diagnostikovaných v předchozích letech. Jde o vícesložkový model kombinující regresní odhady incidence a predikce x-letého přežití pro sledovanou periodu (byl využit logistický regresní model) s tím, že pouze určitá část pacientů diagnostikovaných v minulých letech přežije do hodnoceného roku (celková prevalence).
  3. Odhad rizika relapsu nebo progrese nádorového onemocnění v daném roce. Parametr nezbytný pro predikci počtu pacientů léčených pro relaps nebo progresi základního onemocnění. Při konstrukci těchto odhadů byla využita data o mortalitě na zhoubné nádory z NOR a z registru zemřelých. Ze záznamů o úmrtí pacienta z důvodu základního onkologického onemocnění lze odvodit četnost relapsů, a tedy i pravděpodobnost jejich nastání do 1., 2., .... x. roku od primární diagnózy. Tato pravděpodobnost byla dále extrapolována pro budoucí periodu logistickým regresním modelem. Populační odhady byly nezávisle ověřeny pomocí odhadů provedených vybranou skupinou klinických expertů
  4.  

Obrázek 2. Vícesložkový populační odhad počtu pacientů s protinádorovou terapií

Lokalizace odhadů pro regiony ČR

Veškeré predikce byly následně lokalizovány pro spádové oblasti komplexních onkologických center. Při těchto dílčích výpočtech je zohledňována především epidemiologická situace v daném regionu, ze které se odvozují váhy pro rozdělení populačních predikcí incidence a mortality.

Analýza rizik a pravděpodobnost zkreslení

Veškeré níže uvedené odhady jsou odvozené z populačních epidemiologických dat. Z této skutečnosti plyne i jistá neurčitost a bodové odhady jsou tedy doplněny 90% intervalem spolehlivosti. Každý jednotlivý bodový odhad musí být interpretován neoddělitelně od těchto pravděpodobnostních limitů, které vyjadřují jeho statistickou spolehlivost a zabrání zkreslením. Přesnost predikcí na úrovni regionů může být u některých méně častých diagnóz a klinických stadií snížena v důsledku malé velikostí vzorku. I přes tento fakt byly predikce dělány na všech podsouborech stejnou metodikou a regionální odhady jsou tedy kalkulovány tak, že se v celkovém součtu shodují s populačními odhady.

Scénáře predikcí a korekce provedené u vybraných diagnóz z důvodu významné změny trendů v epidemiologických parametrech

Prediktivní modelování epidemiologické zátěže nám umožňuje pracovat s různými scénáři vývoje populačních charakteristik, což pak logicky vede k různým odhadům incidence a zejména prevalence. Příkladem může být úvaha o vývoji incidence daného nádorového onemocnění, která může buď sledovat určitý dlouhodobý trend, nebo může kolísat okolo určité hodnoty (zátěž vyjádřená na 100 000 obyvatel v populaci). Extrapolace této střední hodnoty je pak preferovaným scénářem v případě nejednoznačného časového trendu u diagnóz s vysokou variabilitou v recentním období. Dalším příkladem využití scénářů může být hodnocení přežití onkologických pacientů. Opět můžeme předpokládat, že se jeho hodnoty v čase již měnit nebudou, a počítat ve výpočtech s hodnotami přežití, které byly identifikovány na co nejvíce recentním datovém souboru pacientů. Na druhou stranu ale můžeme předpokládat, že se přežití pacientů bude i v budoucnu vyvíjet stejným tempem jako doposud. Pak můžeme na dostatečně reprezentativním a recentním souboru pacientů identifikovat trend, který následně promítneme do následujících let, respektive do kalendářních roků, pro něž nemáme hodnoty populačního přežití onkologických pacientů k dispozici. Tento scénář je v publikovaných predikcích preferován. Tyto scénáře lze samozřejmě kombinovat, což při zohlednění i dalších charakteristik, jako je protinádorová terapie, vede k prediktivním modelům odpovídajícím různým možnostem epidemiologického a společenského vývoje v České republice. Jako příklad využití scénářů pro prediktivní modelování v epidemiologii nádorů lze uvést studii Institutu biostatistiky a analýz Lékařské fakulty Masarykovy univerzity, která predikovala počet pacientů s kolorektálním karcinomem, kteří budou pravděpodobně léčení protinádorovou terapií v roce 2015 (Pavlík et al., 2012). Pro účely prezentovaných predikcí byl expertně zvolen adekvátní scénář budoucího vývoje, případné změny scénáře oproti předchozí edici jsou uvedeny a zdůvodněny v této kapitole.

Pro predikce na rok 2018 došlo k dílčím změnám predikčních scénářů. Recentní data Národního onkologického registru ukázala u následujících diagnóz změny časových trendů epidemiologických parametrů. Z těchto důvodů bylo vhodné predikce populační zátěže v čase korigovat, zejména s ohledem na změny v trendech, které nejde jednoznačně předvídat. V následující tabulce uvádíme seznam diagnóz, kde v důsledku nově dostupných dat a změn došlo ke korekcím v publikovaných hodnotách ve srovnání s předchozí edicí epidemiologických predikcí.

Diagnóza

Revize predikčního algoritmu pro rok 2018

Popis dopadu na predikované hodnoty

Zdůvodnění revize

ZN jícnu (C15)

konzervativní extrapolace časového trendu: užití měr incidence v posledních 6 letech

snížení incidence

nerealistický nárůst incidence vyplývající z extrapolace časového trendu – ponechání konzervativního scénáře

Renální karcinom (C64)

konzervativní extrapolace časového trendu: užití měr incidence v posledních 6 letech

mírné snížení incidence

nerealistický nárůst incidence vyplývající z extrapolace časového trendu – ponechání konzervativního scénáře

Vedle uvedených významných korekcí predikcí incidence došlo k následujícím úpravám:

  • U ZN žaludku, NSCLC, ZN děložního hrdla a ZN prostaty byla použita konzervativní extrapolace časového trendu u vybraných stadií, u kterých nebylo možné věrohodně odhadnout časový trend. U ZN žaludku v důsledku toho došlo ke zřetelnějšímu snížení predikované incidence.
  • U ZN jícnu, žaludku, slinivky břišní, NSCLC, ZN vaječníku a varlete byla použita konzervativní extrapolace časového vývoje přežití pacientů, což s výjimkou ZN varlete vedlo ke snížení predikované prevalence.

V této edici predikcí byly využity pro predikce incidence totožné scénáře jako v minulé edici, počty pacientů jsou tedy meziročně konzistentní a dochází pouze k očekávatelným změnám v důsledku dlouhodobých demografických a epidemiologických trendů. Podobně je tomu u prevalence onemocnění; od konzervativní extrapolace časového vývoje přežití bylo upuštěno u NSCLC, kde došlo k navýšení předpovězené prevalence časných stadií.

III. Literatura

• DE ANGELIS, R., M. SANT, M. P. COLEMAN, S. FRANCISCI, et al. Cancer survival in Europe 1999-2007 by country and age: results of EUROCARE--5-a population-based study. Lancet Oncol, Jan 2014, 15(1), 23-34.
• CAPOCACCIA, R., M. COLONNA, I. CORAZZIARI, R. DE ANGELIS, et al. Measuring cancer prevalence in Europe: the EUROPREVAL project. Ann Oncol, Jun 2002, 13(6), 831-839.
• DUSEK, L. AND ET AL. Czech Cancer Care in Numbers 2008-2009. Praha: Grada Publishing, a.s., 2009.
• DUSEK, L., J. MUZIK, D. MALUSKOVA, O. MAJEK, et al. Cancer incidence and mortality in the Czech Republic. Klin Onkol, 2014, 27(6), 406-423.
• DYBA, T. AND T. HAKULINEN Comparison of different approaches to incidence prediction based on simple interpolation techniques. Statistics in Medicine, Jul 15 2000, 19(13), 1741-1752.
• DYBA, T. AND T. HAKULINEN Do cancer predictions work? Eur J Cancer, Feb 2008, 44(3), 448-453.
• ESTEVE, J., E. BENHAMOU AND L. RAYMOND Statistical methods in cancer research. Volume IV - Descriptive epidemiology. Lyon: International Agency for Research on Cancer, 1994. 1-350 p.
• GAIL, M. H., L. KESSLER, D. MIDTHUNE AND S. SCOPPA Two approaches for estimating disease prevalence from population-based registries of incidence and total mortality. Biometrics, Dec 1999, 55(4), 1137-1144.
• HAKULINEN, T. AND T. DYBA Precision of incidence predictions based on Poisson distributed observations. Statistics in Medicine, Aug 15 1994, 13(15), 1513-1523.
• MALVEZZI, M., G. CARIOLI, P. BERTUCCIO, T. ROSSO, et al. European cancer mortality predictions for the year 2016 with focus on leukaemias. Ann Oncol, Apr 2016, 27(4), 725-731.
• MARIOTTO, A. B., K. R. YABROFF, Y. SHAO, E. J. FEUER, et al. Projections of the cost of cancer care in the United States: 2010-2020. J Natl Cancer Inst, Jan 19 2011, 103(2), 117-128.
• MOLLER, B., H. FEKJAER, T. HAKULINEN, L. TRYGGVADOTTIR, et al. Prediction of cancer incidence in the Nordic countries up to the year 2020. Eur J Cancer Prev, Jun 2002, 11 Suppl 1, S1-96.
• MOLLER, B., H. FEKJAER, T. HAKULINEN, H. SIGVALDASON, et al. Prediction of cancer incidence in the Nordic countries: empirical comparison of different approaches. Statistics in Medicine, Sep 15 2003, 22(17), 2751-2766.
• PAVLIK, T., O. MAJEK, J. MUZIK, J. KOPTIKOVA, et al. Estimating the number of colorectal cancer patients treated with anti-tumour therapy in 2015: the analysis of the Czech National Cancer Registry. BMC Public Health, 2012, 12, 117.
• PAVLIK, T., O. MAJEK, T. BUCHLER, R. VYZULA, et al. Trends in stage-specific population-based survival of cancer patients in the Czech Republic in the period 2000-2008. Cancer Epidemiol, Feb 2014, 38(1), 28-34.
• VERDECCHIA, A., G. DE ANGELIS AND R. CAPOCACCIA Estimation and projections of cancer prevalence from cancer registry data. Statistics in Medicine, Nov 30 2002, 21(22), 3511-3526.
• WEIR, H. K., T. D. THOMPSON, A. SOMAN, B. MØLLER, et al. The past, present, and future of cancer incidence in the United States: 1975 through 2020. Cancer, 2015, 121(11), 1827-1837.