Il portale dell'epidemiologia per la sanità pubblica

a cura del Centro nazionale per la prevenzione delle malattie e la promozione della salute dell'Istituto superiore di sanità

utili per lavorare

Sample Size Calculator

(traduzione libera a cura della redazione di EpiCentro)

 

Il Sample Size Calculator è un servizio pubblico realizzato dalla Creative Research Systems. È possibile utilizzare questo strumento per determinare quante persone è necessario intervistare per ottenere risultati che rispecchino con precisione la popolazione bersaglio richiesta. È anche possibile calcolare il livello di precisione di un campione già esistente.

Prima di utilizzare il Sample Size Calculator, può essere utile definire alcuni termini chiave: l’intervallo di confidenza e il livello di confidenza.

  • L’intervallo di confidenza esprime il margine statistico d’errore. Ad esempio, in un campione il 47% ha risposto "sì" a una certa domanda. Con un intervallo di confidenza 4 (cioè del 4%) la percentuale di persone che risponderebbero "sì", nell'eventualità di un’intervista a tappeto a tutta la popolazione, sarebbe compresa fra il 43% (47%-4%) e il 51% (47%+4%).

  • Il livello di confidenza esprime il grado di certezza del risultato. Continuando con l'esempio precedente, porre il livello di confidenza al 95% significa che col 95% di probabilità la percentuale di persone che risponderebbero "sì", nell'eventualità di un’intervista a tappeto a tutta la popolazione, sarebbe compresa fra il 43% (47%-4%) e il 51% (47%+4%).

Mettendo insieme l’intervallo e il livello di confidenza, si è sicuri al 95% che la percentuale reale della popolazione che risponderebbe “sì” è compresa tra il 43% e il 51%.

Fattori che determinano gli intervalli di confidenza
Sono tre i fattori che determinano la grandezza dell’intervallo di confidenza per un certo livello di confidenza: grandezza del campione, percentuale e grandezza della popolazione.

  • Grandezza del campione
    Più il campione è ampio, più è alto il grado di attendibilità delle risposte. Ciò significa che, dato un certo livello di confidenza, più è ampio il campione, più è piccolo l’intervallo di confidenza. Si tratta comunque di una relazione non lineare: per esempio, raddoppiando il campione non si dimezza l’intervallo di confidenza.

  • Percentuale
    L’accuratezza dipende anche dalla distribuzione percentuale delle risposte. Per esempio se il 99% del campione risponde “sì” e l’1% “no”, le probabilità di errore sono remote, indipendentemente dalla grandezza del campione. Nel caso invece di risposte che oscillano intorno al 50%, c’è una maggiore possibilità di ottenere dati non verosimili.

  • Grandezza della popolazione
    Quante persone ci sono nel gruppo che il tuo campione rappresenta? Spesso non si conosce l’esatta grandezza della popolazione, ma questo non è un problema. La statistica dimostra infatti che la grandezza della popolazione è irrilevante, a meno che questo parametro non ecceda di una piccola percentuale la popolazione totale in esame. Per questo motivo il software ignora la grandezza della popolazione quando è ampia o sconosciuta. La grandezza della popolazione è può infatti influire sui risultati solo quando si lavoro con un gruppo relativamente piccolo di persone.

Il calcolo dell’intervallo di confidenza prevede che il campione in esame sia stato già randomizzato.
Vai alla pagina web del Sample Size Calculator.