korábban írtam arról, hogyan kell kiszámítani a Kaplan–Meier görbét a túlélési adatokhoz. Nem parametrikus becslőként jó munkát végez, ha gyorsan megvizsgálja az adatkészlet túlélési görbéjét. Azonban nem engedi, hogy modellezze a kovariánsok túlélésre gyakorolt hatását. Ebben a cikkben a Cox arányos veszélyek modelljére összpontosítunk, amely a túlélési adatok egyik leggyakrabban használt modellje.
bemegyünk néhány mélységet, hogyan kell kiszámítani a becslések., Ez azért értékes, mert látni fogjuk, hogy a becslések csak a hibák megrendelésétől függenek, nem pedig a tényleges idejüktől. Röviden megvitatunk néhány trükkös kérdést az ok-okozati következtetésről, amelyek különlegesek a túlélési elemzéshez.
általában a túlélési adatokra gondolunk az alábbi túlélési görbék tekintetében.,
az X-tengelyen napok alatt van az idő. Az y-tengelyen van (egy becslés) a népességben lévő alanyok százalékos (technikailag arányos) aránya, amely “túléli” az adott időt. A túlélés lehet ábrás vagy szó szerinti., Lehet, hogy az emberek egy bizonyos életkorig élnek-e, függetlenül attól, hogy egy gép bizonyos időt tesz-e le anélkül, hogy lebontaná, vagy lehet, hogy valaki bizonyos ideig munkanélküli marad, miután elvesztette munkáját.
a túlélési elemzés komplikációja az, hogy egyes alanyok nem figyelték meg “halálukat”. Lehet, hogy még életben vannak, egy gép továbbra is működik, vagy valaki még mindig munkanélküli lehet az adatok gyűjtésének időpontjában., Az ilyen megfigyeléseket “jobb cenzúrának” nevezik, a cenzúra kezelése pedig azt jelenti, hogy a túlélési elemzéshez különböző statisztikai eszközökre van szükség.
a túlélő funkciót S-ként, az idő függvényeként jelöljük. Kimenete a T. időpontban túlélő alanyok százalékos aránya (ismét technikailag 0 és 1 közötti arány, de a két szót felváltva fogom használni). Az egyszerűség kedvéért azt a technikai feltételezést fogjuk tenni, hogy ha elég sokáig várunk, minden alany “meghal”.”
az alanyokat indexeljük egy olyan alindextel, mint i vagy j., A hiba alkalommal a teljes népesség jelenik meg egy hasonló alsó index az idő változó t.
Egy újabb finomság, hogy fontolja meg, hogy kezeljük időben, mint a diszkrét (hétről hétre, mondjuk), vagy folyamatos. Filozófiai szempontból csak diszkrét lépésekben mérjük az időt (mondjuk a legközelebbi másodpercre)., Adataink általában csak azt mondják meg nekünk, ha valaki egy adott évben meghalt, vagy ha egy gép egy adott napon meghibásodott. Oda-vissza megyek a diszkrét és folyamatos ügyek között, hogy a kiállítás a lehető legtisztább legyen.
amikor megpróbáljuk modellezni a kovariánsok (pl. életkor, nem, faj, gépgyártó) hatásait, általában érdekelni fogjuk a kovariánsnak a veszélyességi sebességre gyakorolt hatását. A veszélyességi arány a kudarc/halál/állapot átmenet pillanatnyi valószínűsége egy adott időpontban t, attól függően, hogy már túlélték-e ezt a hosszú időt., Meg fogjuk jelölni λ (t). Az idő diszkrét kezelése:
ahol f a teljes valószínűségi sűrűsége hiányában időben t. tudjuk egyesíteni a diszkrét és folyamatos esetekben lehetővé teszi Delta függvények a valószínűségi sűrűség “függvény”. Így az eredmény λ = f / S ugyanaz a folyamatos esetben.
javítsunk egy példát., Tekintsük a klinikai vizsgálat összefüggését, ahol egy gyógyszer kezdetben betegséget okoz a remisszióban. Azt fogjuk mondani, hogy a gyógyszer “kudarcot vall” egy alany számára, amikor a betegség előrehalad egy alany számára. Végül tegyük fel, hogy az alanyok betegségállapotát hetente mérik. Akkor, ha λ (3) = 0,1, ez azt jelenti, hogy 10% esély van arra, hogy egy adott alany esetében, ha a 3.hét előtt még mindig remisszióban vannak, betegségük a 3. héten kezd előrehaladni. A másik 90% remisszióban marad.,
ezután az F teljes valószínűségi sűrűségfüggvény csak az S származéka az idő tekintetében. (Ismét, ha az idő diszkrét, f csak néhány delta funkció összege).,341fa8b2″>A Figyelmeztető Funkció, a Származékos, a Napló S
Ez azt jelenti, hogy ha tudjuk, hogy a Figyelmeztető funkció, meg tudjuk oldani ezt a differenciál egyenlete S:
Ha az idő diszkrét, a szerves összegét a delta funkciók csak átalakul egy összeget a veszélyek minden diszkrét idő.,
Oké, ez összegzi a jelölést és az alapvető fogalmakat, amelyekre szükségünk lesz. Folytassuk a modellek megvitatását.
Non-, Semi -, és teljesen parametrikus modellek
mint korábban említettem, jellemzően a λ Veszélyességi Arány modellezése érdekli.
egy nem parametrikus modellben nem teszünk feltételezéseket a λ funkcionális formájáról. Ebben az esetben a Kaplan–Meier görbe a legnagyobb valószínűség-becslés. A hátránya az, hogy ez megnehezíti a kovariánsok bármilyen hatásának modellezését. Ez egy kicsit olyan, mint egy scatter telek használata, hogy megértsük a kovariáns hatását., Nem feltétlenül olyan hasznos, mint egy teljesen parametrikus modell, mint egy lineáris regresszió.
egy teljesen parametrikus modellben feltételezzük a λ pontos funkcionális formáját. A teljesen parametrikus modellek megvitatása önmagában egy teljes cikk,de érdemes egy nagyon rövid vitát. Az alábbi táblázat három leggyakoribb teljesen parametrikus modellt mutat be. Mindegyik általánosítható a következővel, 1-2-3 paraméterrel. A veszélyességi funkció funkcionális formája a középső oszlopban látható. A veszélyfüggvény logaritmusa az utolsó oszlopban is látható., Minden paraméter (ɣ, α, μ) pozitívnak tekinthető, kivéve, hogy μ lehet 0 az általánosított Weibull eloszlásban (a Weibull Eloszlás reprodukálása).
Nézi a logaritmusát azt mutatja, hogy az exponenciális modell feltételezi, hogy a figyelmeztető funkció állandó. A Weibull modell azt feltételezi, hogy növekszik, ha α >1, állandó, ha α=1, és csökken, ha α< 1., Az általánosított Weibull modell ugyanúgy indul, mint a Weibull modell (az elején ln s = 0). Ezután egy extra kifejezés következik.
ezekkel a modellekkel az a probléma, hogy erős feltételezéseket tesznek az adatokról. Bizonyos kontextusokban okkal feltételezhető, hogy ezek a modellek jól illeszkednek. De ezekkel, valamint számos más lehetőség áll rendelkezésre, fennáll annak a veszélye, hogy helytelen következtetéseket von le a modell hibás meghatározása miatt.
Ez az oka annak, hogy a Cox arányos veszélyek, a félig parametrikus modell annyira népszerű., A Veszélyfüggvény alakjára vonatkozóan nincsenek funkcionális feltevések; ehelyett csak a kovariánsok hatásairól tesznek funkcionális-formai feltételezéseket.,
A Cox arányos veszélyek modellje
A Cox arányos veszélyek modelljét általában a T idő, az X kovariáns vektor és a β együttható