L'epidemiologia comporta la misurazione dell'insorgenza della malattia e la quantificazione delle associazioni tra malattie ed esposizioni.
Misure di occorrenza della malattia
L'insorgenza della malattia può essere misurata da frequenze (conta) ma è meglio descritto da tassi, che sono composti da tre elementi: il numero di persone colpite (numeratore), il numero di persone nella popolazione di origine o di base (cioè la popolazione a rischio) da cui provengono le persone colpite e il periodo di tempo coperto. Il denominatore del tasso è il tempo-persona totale vissuto dalla popolazione di origine. Le tariffe consentono confronti più informativi tra popolazioni di dimensioni diverse rispetto ai soli conteggi. Rischio, la probabilità che un individuo sviluppi una malattia entro un determinato periodo di tempo, è una proporzione, che va da 0 a 1, e non è un tasso di per sé. Tasso di attacco, la proporzione di persone in una popolazione che ne sono colpite entro un determinato periodo di tempo, è tecnicamente una misura del rischio, non un tasso.
La morbilità specifica per malattia include incidenza, che si riferisce al numero di persone a cui è stata recentemente diagnosticata la malattia di interesse. Prevalenza si riferisce al numero di casi esistenti. Mortalità si riferisce al numero di persone che muoiono.
Incidenza è definito come il numero di nuovi casi diagnosticati entro un determinato periodo di tempo, mentre il tasso di incidenza è questo numero diviso per il tempo-persona totale sperimentato dalla popolazione di origine (tabella 1). Per il cancro, i tassi sono generalmente espressi come tassi annuali per 100,000 persone. Le tariffe per altre malattie più comuni possono essere espresse per un numero inferiore di persone. Ad esempio, i tassi di difetti alla nascita sono generalmente espressi per 1,000 nati vivi. Incidenza cumulativa, la proporzione di persone che diventano casi entro un determinato periodo di tempo, è una misura del rischio medio per una popolazione.
Tabella 1. Misure di insorgenza della malattia: Popolazione ipotetica osservata per un periodo di cinque anni
Casi di nuova diagnosi |
10 |
Casi viventi precedentemente diagnosticati |
12 |
Morti, tutte le cause* |
5 |
Morti, malattia di interesse |
3 |
Persone in popolazione |
100 |
Anni osservati |
5 |
Incidenza |
10 persone |
Tasso di incidenza annuale |
|
Prevalenza puntuale (alla fine del quinto anno) |
(10 + 12 - 3) = 19 persone |
Periodo di prevalenza (quinquennio) |
(10 + 12) = 22 persone |
Tasso di mortalità annuale |
|
Tasso di mortalità annuale |
*Per semplificare i calcoli, questo esempio presuppone che tutti i decessi siano avvenuti alla fine del periodo di cinque anni in modo che tutte le 100 persone nella popolazione fossero vive per tutti i cinque anni.
Prevalenza inclusi prevalenza puntiforme, il numero di casi di malattia in un dato momento, e prevalenza del periodo, il numero totale di casi di una malattia nota per essere esistita in un dato momento durante un determinato periodo.
Mortalità, che riguarda i decessi piuttosto che i casi di malattia di nuova diagnosi, riflette i fattori che causano la malattia nonché i fattori legati alla qualità dell'assistenza medica, come lo screening, l'accesso alle cure mediche e la disponibilità di cure efficaci. Di conseguenza, gli sforzi di generazione di ipotesi e la ricerca eziologica possono essere più informativi e più facili da interpretare se basati sull'incidenza piuttosto che sui dati di mortalità. Tuttavia, i dati sulla mortalità sono spesso più facilmente disponibili su grandi popolazioni rispetto ai dati sull'incidenza.
Il termine tasso di mortalità è generalmente accettato per indicare il tasso di decessi per tutte le cause combinate, mentre tasso di mortalità è il tasso di morte per una causa specifica. Per una data malattia, il tasso di mortalità per caso (tecnicamente una proporzione, non un tasso) è il numero di persone che muoiono a causa della malattia durante un periodo di tempo specificato diviso per il numero di persone con la malattia. Il complemento del tasso di mortalità per caso è il tasso di sopravvivenza. Il tasso di sopravvivenza a cinque anni è un punto di riferimento comune per le malattie croniche come il cancro.
L'insorgenza di una malattia può variare tra i sottogruppi della popolazione o nel tempo. Una misura di malattia per un'intera popolazione, senza considerare alcun sottogruppo, è chiamata a tasso grezzo. Ad esempio, un tasso di incidenza per tutti i gruppi di età combinati è un tasso grezzo. Le tariffe per le singole fasce di età sono le tariffe specifiche per età. Per confrontare due o più popolazioni con diverse distribuzioni per età, aggiustato per età (o, standardizzato per età) i tassi dovrebbero essere calcolati per ciascuna popolazione moltiplicando ciascun tasso specifico per età per la percentuale della popolazione standard (ad esempio, una delle popolazioni oggetto di studio, la popolazione degli Stati Uniti del 1970) in quella fascia di età, quindi sommando tutte le fasce di età per produrre un tasso complessivo corretto per l'età. Le tariffe possono essere adattate per fattori diversi dall'età, come razza, sesso o abitudine al fumo, se le tariffe specifiche per categoria sono note.
La sorveglianza e la valutazione dei dati descrittivi possono fornire indizi sull'eziologia della malattia, identificare sottogruppi ad alto rischio che possono essere adatti per programmi di intervento o screening e fornire dati sull'efficacia di tali programmi. Le fonti di informazioni che sono state utilizzate per le attività di sorveglianza includono certificati di morte, cartelle cliniche, registri dei tumori, registri di altre malattie (ad es. registri dei difetti alla nascita, registri delle malattie renali allo stadio terminale), registri dell'esposizione professionale, registri delle assicurazioni sanitarie o di invalidità e indennità dei lavoratori record.
Misure di associazione
L'epidemiologia tenta di identificare e quantificare i fattori che influenzano la malattia. Nell'approccio più semplice, l'insorgenza della malattia tra le persone esposte a un fattore sospetto viene confrontata con l'insorgenza tra le persone non esposte. L'entità di un'associazione tra esposizione e malattia può essere espressa in entrambi assoluto or parente termini. (Vedi anche "Case Study: Misure").
Gli effetti assoluti sono misurati da differenze di tasso ed differenze di rischio (Tavolo 2). UN differenza di tasso è un tasso meno un secondo tasso. Ad esempio, se il tasso di incidenza della leucemia tra i lavoratori esposti al benzene è di 72 per 100,000 anni-persona e il tasso tra i lavoratori non esposti è di 12 per 100,000 anni-persona, allora la differenza di tasso è di 60 per 100,000 anni-persona. UN differenza di rischio è una differenza nei rischi o nell'incidenza cumulativa e può variare da -1 a 1.
Tabella 2. Misure di associazione per uno studio di coorte
Astuccio |
Anni-persona a rischio |
Tariffa per 100,000 |
|
Exposed |
100 |
20,000 |
500 |
Non esposto |
200 |
80,000 |
250 |
Totale |
300 |
100,000 |
300 |
Differenza tariffaria (RD) = 500/100,000 - 250/100,000
= 250/100,000 all'anno
(146.06/100,000 - 353.94/100,000)*
Rate ratio (o rischio relativo) (RR) =
Rischio attribuibile agli esposti (ARe) = 100/20,000 - 200/80,000
= 250/100,000 all'anno
Percentuale di rischio attribuibile negli esposti (ARe%) =
Rischio attribuibile alla popolazione (PAR) = 300/100,000 - 200/80,000
= 50/100,000 all'anno
Percentuale di rischio attribuibile alla popolazione (PAR%) =
* Tra parentesi intervalli di confidenza al 95% calcolati utilizzando le formule nelle caselle.
Effetti relativi si basano su rapporti di tassi o misure di rischio, invece che su differenze. UN rapporto tariffario è il rapporto tra un tasso in una popolazione e il tasso in un'altra. Il tasso di rapporto è stato anche chiamato il rapporto di rischio, rischio relativo, tasso relativoe incidenza (o mortalità) rapporto tariffario. La misura è adimensionale e va da 0 a infinito. Quando il tasso in due gruppi è simile (vale a dire, non vi è alcun effetto dall'esposizione), il rapporto tariffario è uguale all'unità (1). Un'esposizione che aumenta il rischio produrrebbe un rapporto di tasso maggiore dell'unità, mentre un fattore protettivo produrrebbe un rapporto compreso tra 0 e 1. Il eccesso di rischio relativo è il rischio relativo meno 1. Ad esempio, un rischio relativo di 1.4 può anche essere espresso come un eccesso di rischio relativo del 40%.
Negli studi caso-controllo (chiamati anche studi caso-referente), vengono identificate le persone con malattia (casi) e le persone senza malattia (controlli o referenti). Vengono confrontate le esposizioni pregresse dei due gruppi. Le probabilità di essere un caso esposto vengono confrontate con le probabilità di essere un controllo esposto. Non sono disponibili conteggi completi delle popolazioni di origine delle persone esposte e non esposte, quindi i tassi di malattia non possono essere calcolati. Invece, i casi esposti possono essere confrontati con i controlli esposti mediante calcolo di probabilità relativeo rapporto di probabilità (tabella 3).
Tabella 3. Misure di associazione per studi caso-controllo: Esposizione a polvere di legno e adenocarcinoma della cavità nasale e dei seni paranasali
Astuccio |
Controls |
|
Exposed |
18 |
55 |
Non esposto |
5 |
140 |
Totale |
23 |
195 |
Quote relative (rapporto quote) (OR) =
Percentuale di rischio attribuibile negli esposti () =
Percentuale di rischio attribuibile alla popolazione (PAR%) =
where = percentuale di controlli esposti = 55/195 = 0.28
* Tra parentesi intervalli di confidenza al 95% calcolati utilizzando le formule nel riquadro a tergo.
Fonte: Adattato da Hayes et al. 1986.
Le misure relative dell'effetto vengono utilizzate più frequentemente delle misure assolute per segnalare la forza di un'associazione. Le misure assolute, tuttavia, possono fornire una migliore indicazione dell'impatto sulla salute pubblica di un'associazione. Un piccolo aumento relativo di una malattia comune, come le malattie cardiache, può interessare più persone (grande differenza di rischio) e avere un impatto maggiore sulla salute pubblica rispetto a un grande aumento relativo (ma piccola differenza assoluta) di una malattia rara, come angiosarcoma del fegato.
Test di significato
Il test per la significatività statistica viene spesso eseguito su misure di effetto per valutare la probabilità che l'effetto osservato differisca dall'ipotesi nulla (cioè nessun effetto). Mentre molti studi, in particolare in altre aree della ricerca biomedica, possono esprimere significato per valori p p, studi epidemiologici tipicamente presenti intervalli di confidenza (CI) (chiamato anche limiti di confidenza). Un intervallo di confidenza del 95%, ad esempio, è un intervallo di valori per la misura dell'effetto che include la misura stimata ottenuta dai dati dello studio e quella che ha il 95% di probabilità di includere il valore reale. Si ritiene improbabile che i valori al di fuori dell'intervallo includano la vera misura dell'effetto. Se l'intervallo di confidenza per un rapporto di frequenza include l'unità, non vi è alcuna differenza statisticamente significativa tra i gruppi confrontati.
Gli intervalli di confidenza sono più informativi dei soli valori p. La dimensione di un valore p è determinata da uno o entrambi i due motivi. O la misura dell'associazione (p. es., rate ratio, differenza di rischio) è grande o le popolazioni studiate sono grandi. Ad esempio, una piccola differenza nei tassi di malattia osservata in una vasta popolazione può produrre un valore p altamente significativo. Le ragioni dell'elevato valore p non possono essere identificate dal solo valore p. Gli intervalli di confidenza, tuttavia, ci consentono di districare i due fattori. Innanzitutto, l'entità dell'effetto è distinguibile dai valori della misura dell'effetto e dai numeri compresi nell'intervallo. Rapporti di rischio più elevati, ad esempio, indicano un effetto più forte. In secondo luogo, la dimensione della popolazione influisce sull'ampiezza dell'intervallo di confidenza. Piccole popolazioni con stime statisticamente instabili generano intervalli di confidenza più ampi rispetto a popolazioni più grandi.
Il livello di confidenza scelto per esprimere la variabilità dei risultati (la "significatività statistica") è arbitrario, ma è stato tradizionalmente del 95%, che corrisponde a un p-value di 0.05. Un intervallo di confidenza del 95% ha una probabilità del 95% di contenere la vera misura dell'effetto. Occasionalmente vengono utilizzati altri livelli di confidenza, come il 90%.
Le esposizioni possono essere dicotomiche (es. esposte e non esposte) o possono comportare molti livelli di esposizione. Le misure dell'effetto (cioè la risposta) possono variare in base al livello di esposizione. Valutare esposizione-risposta relazioni è una parte importante dell'interpretazione dei dati epidemiologici. L'analogo all'esposizione-risposta negli studi sugli animali è la "dose-risposta". Se la risposta aumenta con il livello di esposizione, è più probabile che un'associazione sia causale rispetto a quando non si osserva alcuna tendenza. I test statistici per valutare le relazioni esposizione-risposta includono il test di estensione di Mantel e il test di tendenza chi-quadrato.
Standardizzazione
Per tenere conto di fattori diversi dall'esposizione primaria di interesse e dalla malattia, possono essere adottate misure di associazione standardizzato attraverso tecniche di stratificazione o regressione. Stratificazione significa dividere le popolazioni in gruppi omogenei rispetto al fattore (es. gruppi di genere, gruppi di età, gruppi di fumatori). Per ogni strato vengono calcolati i rapporti di rischio o gli odds ratio e vengono calcolate le medie ponderate complessive dei rapporti di rischio o degli odds ratio. Questi valori complessivi riflettono l'associazione tra l'esposizione primaria e la malattia, aggiustata per il fattore di stratificazione, cioè l'associazione con gli effetti del fattore di stratificazione rimosso.
A rapporto tariffario standardizzato (SRR) è il rapporto tra due tassi standardizzati. In altre parole, un SRR è una media ponderata di rapporti di tasso specifici per strato in cui i pesi per ogni strato sono la distribuzione tempo-persona del gruppo non esposto o referente. Gli SRR per due o più gruppi possono essere confrontati se vengono utilizzati gli stessi pesi. Gli intervalli di confidenza possono essere costruiti per gli SRR come per i rate ratio.
I tasso di mortalità standardizzato (SMR) è una media ponderata di rapporti di frequenza specifici per età in cui i pesi (ad esempio, persona-tempo a rischio) provengono dal gruppo oggetto di studio e i tassi provengono dalla popolazione di riferimento, l'opposto della situazione in un SRR. La popolazione di riferimento abituale è la popolazione generale, i cui tassi di mortalità possono essere prontamente disponibili e basati su grandi numeri e quindi sono più stabili rispetto all'utilizzo di tassi di una coorte o sottogruppo non esposto della popolazione occupazionale oggetto di studio. L'utilizzo dei pesi della coorte anziché della popolazione di riferimento si chiama standardizzazione indiretta. L'SMR è il rapporto tra il numero osservato di decessi nella coorte e il numero atteso, basato sui tassi della popolazione di riferimento (il rapporto è tipicamente moltiplicato per 100 per la presentazione). Se non esiste alcuna associazione, l'SMR è uguale a 100. Va notato che poiché i tassi provengono dalla popolazione di riferimento ei pesi provengono dal gruppo di studio, due o più SMR tendono a non essere confrontabili. Questa non comparabilità viene spesso dimenticata nell'interpretazione dei dati epidemiologici e si possono trarre conclusioni errate.
Effetto lavoratore sano
È molto comune che le coorti occupazionali abbiano una mortalità totale inferiore rispetto alla popolazione generale, anche se i lavoratori sono a maggior rischio per determinate cause di morte dovute all'esposizione sul posto di lavoro. Questo fenomeno, chiamato effetto lavoratore sano, riflette il fatto che qualsiasi gruppo di occupati è probabilmente più sano, in media, della popolazione generale, che comprende i lavoratori e le persone inabili al lavoro a causa di malattie e disabilità. Il tasso di mortalità complessivo nella popolazione generale tende ad essere superiore al tasso nei lavoratori. L'effetto varia in intensità a seconda della causa della morte. Ad esempio, sembra essere meno importante per il cancro in generale che per la malattia polmonare ostruttiva cronica. Uno dei motivi è che è probabile che la maggior parte dei tumori non si sarebbe sviluppata a causa di una predisposizione al cancro alla base della selezione del lavoro/della carriera in giovane età. L'effetto lavoratore sano in un dato gruppo di lavoratori tende a diminuire nel tempo.
Mortalità proporzionale
A volte non è disponibile una tabulazione completa di una coorte (ad es. tempo persona a rischio) e sono disponibili informazioni solo sui decessi o su alcuni sottoinsiemi di decessi vissuti dalla coorte (ad es. decessi tra pensionati e dipendenti attivi, ma non tra lavoratori che ha lasciato il lavoro prima di aver maturato il diritto alla pensione). Il calcolo degli anni-persona richiede metodi speciali per gestire la valutazione del tempo-persona, compresi i metodi della tabella di vita. Senza informazioni sul tempo totale per persona su tutti i membri della coorte, indipendentemente dallo stato della malattia, non è possibile calcolare SMR e SRR. Invece, tassi proporzionali di mortalità (PMR) possono essere utilizzati. Un PMR è il rapporto tra il numero osservato di decessi dovuti a una causa specifica rispetto al numero previsto, basato sulla proporzione di decessi totali dovuti alla causa specifica nella popolazione di riferimento, moltiplicato per il numero di decessi totali nello studio gruppo, moltiplicato per 100.
Poiché la proporzione di decessi per tutte le cause combinate deve essere uguale a 1 (PMR=100), alcuni PMR possono sembrare in eccesso, ma in realtà sono gonfiati artificialmente a causa di deficit reali in altre cause di morte. Allo stesso modo, alcuni deficit apparenti possono semplicemente riflettere gli eccessi reali di altre cause di morte. Ad esempio, se gli applicatori aerei di pesticidi hanno un grande eccesso reale di decessi dovuti a incidenti, il requisito matematico che il PMR per tutte le cause combinate sia uguale a 100 può far apparire carente una o altre cause di morte anche se la mortalità è eccessiva. Per migliorare questo potenziale problema, i ricercatori interessati principalmente al cancro possono calcolare rapporti di mortalità per cancro proporzionati (PCMR). I PCMR confrontano il numero osservato di decessi per cancro con il numero previsto in base alla percentuale di decessi totali per cancro (piuttosto che tutti i decessi) per il cancro di interesse nella popolazione di riferimento moltiplicato per il numero totale di decessi per cancro nel gruppo di studio, moltiplicato per 100. Pertanto, il PCMR non sarà influenzato da un'aberrazione (eccesso o deficit) in una causa di morte non cancerosa, come incidenti, malattie cardiache o malattie polmonari non maligne.
Gli studi PMR possono essere analizzati meglio utilizzando odds ratio di mortalità (MOR), in sostanza analizzando i dati come se provenissero da uno studio caso-controllo. I "controlli" sono i decessi derivanti da un sottoinsieme di tutti i decessi che si ritiene non siano correlati all'esposizione oggetto di studio. Ad esempio, se l'interesse principale dello studio fosse il cancro, gli odds ratio di mortalità potrebbero essere calcolati confrontando l'esposizione tra i decessi per cancro con l'esposizione tra i decessi cardiovascolari. Questo approccio, come il PCMR, evita i problemi con il PMR che sorgono quando una fluttuazione in una causa di morte influisce sul rischio apparente di un'altra semplicemente perché il PMR complessivo deve essere uguale a 100. La scelta delle cause di morte di controllo è comunque critica . Come accennato in precedenza, non devono essere correlati all'esposizione, ma la possibile relazione tra esposizione e malattia potrebbe non essere nota per molte potenziali malattie di controllo.
Rischio attribuibile
Sono disponibili misure che esprimono la quantità di malattia che sarebbe attribuibile a un'esposizione se l'associazione osservata tra l'esposizione e la malattia fosse causale. Il rischio attribuibile agli esposti (ARe) è il tasso di malattia negli esposti meno il tasso nei non esposti. Poiché i tassi di malattia non possono essere misurati direttamente negli studi caso-controllo, l'ARe è calcolabile solo per gli studi di coorte. Una misura correlata, più intuitiva, la percentuale di rischio attribuibile negli esposti (ARe%), può essere ottenuto da entrambi i disegni di studio. L'ARe% è la proporzione di casi verificatisi nella popolazione esposta attribuibile all'esposizione (vedere la tabella 2 e la tabella 3 per la formula). L'ARe% è il rate ratio (o odds ratio) meno 1, diviso per il rate ratio (o odds ratio), moltiplicato per 100.
I rischio attribuibile alla popolazione (PAR) e il percentuale di rischio attribuibile alla popolazione (PAR%), o frazione eziologica, esprimono la quantità di malattia nella popolazione totale, che comprende persone esposte e non esposte, che è dovuta all'esposizione se l'associazione osservata è causale. Il PAR può essere ottenuto da studi di coorte (tabella 28.3) e il PAR% può essere calcolato sia in studi di coorte che in studi caso-controllo (tabella 2 e tabella 3).
Rappresentatività
Ci sono diverse misure di rischio che sono state descritte. Ciascuno assume metodi sottostanti per il conteggio degli eventi e nei rappresentanti di questi eventi a un gruppo definito. Quando i risultati vengono confrontati tra gli studi, la comprensione dei metodi utilizzati è essenziale per spiegare eventuali differenze osservate.