(traduzione libera a cura della redazione di EpiCentro)
Il
Sample Size Calculator è un servizio pubblico realizzato dalla Creative
Research Systems. È possibile utilizzare questo strumento per determinare
quante persone è necessario intervistare per ottenere risultati che
rispecchino con precisione la popolazione bersaglio richiesta. È anche
possibile calcolare il livello di precisione di un campione già esistente.
Prima di utilizzare il Sample Size Calculator, può essere utile definire
alcuni termini chiave: l’intervallo di confidenza e il livello di
confidenza.
L’intervallo di confidenza esprime il margine statistico d’errore. Ad esempio, in un campione il 47% ha risposto "sì" a una certa domanda. Con un intervallo di confidenza 4 (cioè del 4%) la percentuale di persone che risponderebbero "sì", nell'eventualità di un’intervista a tappeto a tutta la popolazione, sarebbe compresa fra il 43% (47%-4%) e il 51% (47%+4%).
Il livello di confidenza esprime il grado di certezza del risultato. Continuando con l'esempio precedente, porre il livello di confidenza al 95% significa che col 95% di probabilità la percentuale di persone che risponderebbero "sì", nell'eventualità di un’intervista a tappeto a tutta la popolazione, sarebbe compresa fra il 43% (47%-4%) e il 51% (47%+4%).
Mettendo insieme l’intervallo e il livello di confidenza, si è sicuri al
95% che la percentuale reale della popolazione che risponderebbe “sì” è
compresa tra il 43% e il 51%.
Fattori che determinano gli intervalli di confidenza
Sono tre i fattori che determinano la grandezza
dell’intervallo di confidenza per un certo livello di confidenza: grandezza
del campione, percentuale e grandezza della popolazione.
Grandezza
del campione
Più il campione è ampio, più è alto il grado di attendibilità delle
risposte. Ciò significa che, dato un certo livello di confidenza, più è
ampio il campione, più è piccolo l’intervallo di confidenza. Si tratta
comunque di una relazione non lineare: per esempio, raddoppiando il campione
non si dimezza l’intervallo di confidenza.
Percentuale
L’accuratezza dipende anche dalla distribuzione percentuale delle risposte.
Per esempio se il 99% del campione risponde “sì” e l’1% “no”, le probabilità
di errore sono remote, indipendentemente dalla grandezza del campione. Nel
caso invece di risposte che oscillano intorno al 50%, c’è una maggiore
possibilità di ottenere dati non verosimili.
Grandezza
della popolazione
Quante persone ci sono nel gruppo che il tuo campione rappresenta?
Spesso non si conosce l’esatta grandezza della popolazione, ma questo non è
un problema. La statistica dimostra infatti che la grandezza della
popolazione è irrilevante, a meno che questo parametro non ecceda di una
piccola percentuale la popolazione totale in esame. Per questo motivo il
software ignora la grandezza della popolazione quando è ampia o sconosciuta.
La grandezza della popolazione è può infatti influire sui risultati solo
quando si lavoro con un gruppo relativamente piccolo di persone.
Il calcolo dell’intervallo di confidenza prevede che il campione in esame
sia stato già randomizzato.
Vai alla pagina web del
Sample Size Calculator.