ISSN 1804-6371
 
 

Zdrojová data a metodika predikce 2014

Cíle

Cílem analýzy je poskytnout informační základ pro racionální diskuzi o nákladech protinádorové terapie a o počtech léčených pacientů v roce 2014. Konkrétními výstupy projektu jsou následující materiály (vždy pro vybrané modelové diagnózy)

  • audit populačních dat Národního onkologického registru a definice referenčního souboru
  • odhady incidence pro rok 2014 a počty nově diagnostikovaných pacientů, kteří budou protinádorově léčeni v primární terapii
  • odhady prevalence dle různých stadií onemocnění k roku 2014 a odhady počtu pacientů, kteří prodělají relaps/progresi nádorového onemocnění a budou léčeni v roce 2014
  • metodické standardy a referenční data, která umožní další rozvíjení provedených analýz (jiné diagnózy, jiná léčiva, další modality protinádorové terapie, regionální analýzy aj.).

Zdrojová data

K analýzám byla použita pouze validní populační data, oficiálně získaná od zákonem určených správců. Data byla analyzována v anonymizované podobě, tedy bez přímých i nepřímých identifikátorů konkrétní osoby, pacienta. Konkrétně jde o následující zdroje:

  • Národní onkologický registr ČR (správce a poskytovatel dat: ÚZIS ČR). Standardně sbíraná epidemiologická databáze o zhoubných nádorech s více než 1,8 mil. záznamů od roku 1977 do současnosti. Časově aktuálnější referenční soubor dat definovaný pro období 1995–2010 zahrnuje záznamy téměř 800 000 pacientů. Aktuální populační data jsou takto k dispozici k roku 2010, situace v následujících letech byla předmětem níže popsaných prognóz.
  • Demografická data populace ČR a registr zemřelých (správce a poskytovatel dat: ČSÚ ČR) tvoří nepostradatelnou informační základnu pro prediktivní hodnocení epidemiologických dat. Pomocí těchto dat byly korigovány věkově standardizované modely přežití.
  • Expertní odhady zaměřené na hodnoty, které není možné z populačních dat věrohodně získat: pravděpodobnost diseminovaných relapsů u různých stadií onemocnění v různou dobu od ukončení primární terapie a pravděpodobnost absolvování různých linií léčby u metastatických onemocnění.

Audit dat NOR z let 1995–2010 odhalil, že jde o databázi dostatečně kvalitní a pro podmínky ČR i plně reprezentativní. I minimalizovaný počet parametrů z takto koncipovaného populačního registru poskytuje cenné údaje pro hodnocení zdravotnického systému:

  • záznamy o diagnóze, datu diagnózy a způsobu diagnózy
    • hodnocení zátěže regionů nebo spádových oblastí nemocnic nově diagnostikovanými onkologickými pacienty, včetně trendů a prognóz
    • výkonnost diagnostiky v hodnocené oblasti
  • záznamy o datu úmrtí
    • hodnocení celkových výsledků péče (celkového přežití)
    • odhady prevalence, včetně trendů a prognóz
  • diagnostické záznamy (klinické stadium, TNM klasifikace nádoru)
    • výkonnost diagnostiky, schopnost zachytávat méně pokročilé stavy
    • relevantní odhady přežití vztažené na stav nemoci při diagnóze
    • odhady léčebné zátěže a s ní souvisejících nákladů

Definice referenčního souboru dat pro klinická hodnocení a analýzu nákladů

Korektní definice referenčních dat je základem věrohodnosti analýz, což je zvláště významné u prediktivních modelů. Chceme-li definovat populační rámec pro hodnocení výsledků a nákladů péče, musíme z populačních registrů čerpat údaje s jistým omezením:

  • Data musí být aktuální a musí reflektovat současnou situaci českého zdravotnictví. Historické trendy mohou být velmi zavádějící. Zásadní jsou údaje od pacientů, kteří skutečně prošli zdravotnickým zařízením a byli léčeni. Počty pacientů diagnostikovaných např. při pitvě sice mají epidemiologický význam, ale hodnocení nákladů nijak neovlivňují.

Této analýze jsme podrobili Národní onkologický registr ČR. Z důvodu aktuálnosti jsme rozsah analyzovaných dat omezili na období 1995–2010, kdy v databázi NOR můžeme pracovat s validními záznamy podle novějších verzí klasifikace TNM. Data z tohoto období představují dostatečně velký vzorek pro populační analýzy (Obr. 1). Velmi podstatné je vyčlenění záznamů o pacientech s nedokončenou diagnostikou v důsledku odmítnutí léčby, komplikací nebo časného úmrtí, neboť tyto záznamy by zkresloval; analýzy o nákladech na protinádorovou terapii. Ve shodě s literaturou byla použita hranice časného úmrtí do 1 měsíce od diagnózy.

Výsledkem auditu dostupných populačních dat je tedy referenční soubor kvalitních a věrohodných záznamů, které zachycují léčbu a výsledky léčby u pacientů s řádně dokončenou diagnostikou. Jak dokumentuje obr. 1, i následná separace protinádorově léčených a neléčených pacientů ještě stále poskytuje dostatečně velký vzorek pro populační analýzy.

Obrázek 1. Navržená cesta k referenčnímu souboru populačních dat pro hodnocení výsledků a nákladů péče (Národní onkologický registr ČR, 1995–2010)

Stručný metodický popis provedených výpočtů

Máme-li k dispozici referenční soubor dat, můžeme jej využít pro odhady dalších komponent nezbytných pro analýzy výsledků a nákladů léčebné péče. Smyslem těchto výpočtů je dospět ke spolehlivému odhadu počtu pacientů žijících v daném období a vyžadujících protinádorovou terapii. Podle podílu klinických stadií u žijících pacientů lze následně při znalosti možných scénářů léčby odhadnout i očekávané náklady. Jelikož u populačních registrů dostáváme data vždy s jistým zpožděním, jsou níže vyjmenované odhady prováděny prospektivně:

  1. Odhady incidence a mortality. Odhady byly provedeny jednak pro celková data a jednak odděleně pro klinická stadia. Metodika vychází z epidemiologických trendů za známé období a koriguje je s ohledem na pravděpodobné demografické změny populace. Byl použit Poissonův regresní model s odhady doplněnými intervaly spolehlivosti.
  2. Odhad prevalence pacientů s protinádorovou terapií. Prospektivní odhad prevalence kombinuje odhady počtu nově diagnostikovaných pacientů v budoucích letech a pravděpodobnost x-letého přežití u pacientů diagnostikovaných v předchozích letech. Jde tedy o vícesložkový odhad, který kombinuje regresní odhady incidence a analýzy x-letého přežití s tím, že pouze určitá část pacientů diagnostikovaných (a léčených) v minulých letech přežije do hodnoceného roku (celková prevalence) a dále pouze určitá část z nich prodělá relaps nebo progresi onemocnění, a je tedy v daném roce opět protinádorově léčena (viz též obrázek 2).
  3. Odhad x-letého přežitá onkologicky nemocných pacientů. Vzhledem k výrazným časovým změnám v dosahovaném přežití onkologických pacientů od roku 1977 do roku 2010 byl pro výpočet x-letého přežití použit postup založený na principu tzv. pohyblivého časového okna (anglicky „moving window“). Jedná se o postupný odhad x-letého přežití analýzou kohort definovaných 5letým časovým intervalem, který obsahuje rok diagnózy vzdálené x-1 a x let od roku 2010, tedy pacienti diagnostikovaní v letech 2006–2010 budou přispívat k odhadu 1letého až 5letého přežití, pacienti diagnostikovaní v letech 2005–2009 budou přispívat k odhadu 2letého až 6letého přežití, atd. Šířka intervalu definujícího jednu kohortu byla stanovena na 5 let, neboť se jedná o standardní šířku využívanou při populační analýze přežití (Berrino a kol., 2007).
  4. Odhad četnosti (pravděpodobnosti) relapsu nebo progrese nádorového onemocnění v daném roce. Velmi podstatný parametr, nezbytný pro odhad počtu pacientů léčených pro relaps nebo progresi základního onemocnění. Při konstrukci těchto odhadů byla využita data o mortalitě na zhoubné nádory z NOR a z registru zemřelých. (přesné datum a příčina úmrtí). Ze záznamů o smrti pacienta z důvodu základního onkologického onemocnění lze odvodit četnost relapsů, a tedy i pravděpodobnost jejich nastání do 1., 2., .... x. roku od primární diagnózy. Jelikož právě tyto „poslední“ relapsy (u pokročilých klinických stadií se jedná o progrese) vedou k diseminovanému a léčebně velmi nákladnému onemocnění, jde o odhad relevantní právě pro hodnocení nákladů. Populační odhady byly nezávisle ověřeny pomocí odhadů provedených vybranou skupinou klinických expertů.

Opakované provádění těchto prediktivních odhadů odhalil u pravděpodobnosti nastání relapsu v x. roce od diagnózy silný časový trend. Odhad této pravděpodobnosti je tedy počítán pouze z posledních pěti let, kdy jsou takové údaje dostupné. Např. údaj o jednoleté pravděpodobnosti relapsu (tj. pravděpodobnost nastání diseminovaného relapsu v roce následujícím bezprostředně po diagnóze onemocnění) je počítán z údajů pacientů diagnostikovaných postupně v letech 2005–2009 (kteří relabují postupně v letech 2006–2010), nikoliv z údajů pacientů diagnostikovaných před rokem 2005. Tento početní přístup poskytuje relevantnější a časově aktuálnější údaje.

Obrázek 2. Vícesložkový populační odhad počtu pacientů s protinádorovou terapií v daném roce

Lokalizace odhadů pro regiony ČR

Veškeré výše uvedené odhady pro celou českou populaci jsou následně lokalizovány pro spádové oblasti komplexních onkologických center a skupin. Při těchto dílčích výpočtech je zohledňována především epidemiologická situace v daném regionu, ze které se odvozují váhy pro rozdělení populačních predikcí incidence a mortality.

Analýza rizik a pravděpodobnost zkreslení

Veškeré níže uvedené odhady jsou odvozené z populačních epidemiologických dat. Z této skutečnosti plyne i jistá neurčitost a bodové odhady byly tedy doplněny 90% intervalem spolehlivosti. Každý jednotlivý bodový odhad musí být interpretován neoddělitelně od těchto pravděpodobnostních limitů, které vyjadřují jeho statistickou spolehlivost a zabrání případným zkreslením. Přesnost predikcí na úrovni regionů může být u některých méně častých diagnóz a klinických stadií snížena v důsledku malé velikostí vzorku. I přes tento fakt byly predikce dělány na všech pod-souborech striktně stejnou metodikou a regionální odhady jsou tedy kalkulovány tak, že se v celkovém součtu shodují s populačními odhady.

Literatura

  • Agresti A. (2002): Categorical data analysis, Wiley-interscience
  • Brenner H., Arndt V.: Long-term survival rates of patients with prostate cancer in the prostate-specific antigen screening era: population-based estimates for the year 2000 by period analysis. J. Clin. Oncol., 23(3), 441–447, 2005.
  • Berrino F., DeAngelis R., Sant M. et al.: Survival for eight major cancers and all cancers combined for European adults diagnosed in 1995-99: results of the EUROCARE-4 study. Lancet Oncology, published online in August 21, 2007: http://oncology.thelancet.com.
  • Cantor A.B. (2001): Projecting the standart error of the Kaplan-Meier estimator, Statistics in medicine, 20: 2091-2097
  • Capocaccia R., De Angelis R. (1997): Estimating the completeness of prevalence based on cancer registry data, Statistics in medicine, 16: 425-440
  • Capocaccia R. et al. (2002): Measuring prevalence in Europe: the EUROPREVAL project, Annals of Oncology, 13: 831-839
  • Dickman P., Hakulinen T. (2003): Population-based cancer survival analysis, draft, http://www.pauldickman.com/teaching/tampere2004/book_draft.pdf
  • dos Santos Silva I. Cancer Epidemiology: Principles and Methods. International Agency for Research on Cancer: Lyon, 1999.
  • Dušek L., Žaloudík J. (Eds.): Hodnocení zdravotnických technologií v onkologii. Klinická onkologie 17 – Supplement 2004, 104 s. ISSN 0862 – 495 X.
  • Dušek L., Žaloudík J., Indrák K. (Eds): Informační zázemí pro využití onkologických populačních dat v ČR. Zvláštní vydání časopisu Klinická onkologie, ISSN 0862-495X, 2007, v tisku
  • Dyba T., Hakulinen T. (2000): Comparison of differenet approaches to incidence prediction based on simple interpolation techniques, Statistics in medicine, 19: 1741-1752
  • Gail M.H., Kesser L., Midthune D., Scoppa S. (1999): Two approaches for estimation disease prevalence from Population-based registries of incidence and total mortality, Biometrics, 55: 1137-1144
  • Hakulinen T., Dyba T. (1994): Precision of incidence predictions based on Poisson distributed observations, Statistics in medicine, 13: 1513-1523
  • Chambers J.M. , Hastie T.J. (eds.) (1991): Statistical models in S, Chapman& Hall/CRC
  • Lutz et al. (2003): Cancer prevalence in Central Europe: the EUROPREVAL study, Annals of Oncology, 14: 313-322.
  • Mariotto A.B., Yabroff K.R., Feuer E., De Angelis R., Brown M. (2006): Projectiong the number of patients with colorectal carcinoma by phase of care in US: 2000-2020, Cancer causes control, 17: 1215-1226.
  • Mariotto A. Waren J.L., Knopf K.B., Feuer E.J. (2003): The prevalence of patients with colorectal carcinoma under care in the U.S., Cancer, 98: 1253-1261
  • Møller B., Weedon-Fekjæer H., Haldorsen T. (2005).: Empirical evaluation of prediction intervals for cancer incidence. BMC Medical Reasearch Methodology. 5:21 http://www.biomedcentral.com/1471-2288/5/21
  • Pohar M., Stare J. (2006): Relative survival analysis in R, Computer mwthods and programs in biomedicine, 81: 272-278
  • Verdecchia A., De Angelis Giovanni, Capocaccia R. (2002): Estimation and projection of cancer prevalence from cancer registry data. Statistics in medicine, 21: 3511-3526