Sample Size Calculator
(traduzione libera a cura della redazione di EpiCentro)
Il
Sample Size Calculator è un servizio pubblico realizzato dalla Creative
Research Systems. È possibile utilizzare questo strumento per determinare
quante persone è necessario intervistare per ottenere risultati che
rispecchino con precisione la popolazione bersaglio richiesta. È anche
possibile calcolare il livello di precisione di un campione già esistente.
Prima di utilizzare il Sample Size Calculator, può essere utile definire
alcuni termini chiave: l’intervallo di confidenza e il livello di
confidenza.
-
L’intervallo di confidenza esprime il margine statistico d’errore. Ad esempio, in un campione il 47% ha risposto "sì" a una certa domanda. Con un intervallo di confidenza 4 (cioè del 4%) la percentuale di persone che risponderebbero "sì", nell'eventualità di un’intervista a tappeto a tutta la popolazione, sarebbe compresa fra il 43% (47%-4%) e il 51% (47%+4%).
-
Il livello di confidenza esprime il grado di certezza del risultato. Continuando con l'esempio precedente, porre il livello di confidenza al 95% significa che col 95% di probabilità la percentuale di persone che risponderebbero "sì", nell'eventualità di un’intervista a tappeto a tutta la popolazione, sarebbe compresa fra il 43% (47%-4%) e il 51% (47%+4%).
Mettendo insieme l’intervallo e il livello di confidenza, si è sicuri al
95% che la percentuale reale della popolazione che risponderebbe “sì” è
compresa tra il 43% e il 51%.
Fattori che determinano gli intervalli di confidenza
Sono tre i fattori che determinano la grandezza dell’intervallo di
confidenza per un certo livello di confidenza: grandezza del campione,
percentuale e grandezza della popolazione.
-
Grandezza del campione
Più il campione è ampio, più è alto il grado di attendibilità delle risposte. Ciò significa che, dato un certo livello di confidenza, più è ampio il campione, più è piccolo l’intervallo di confidenza. Si tratta comunque di una relazione non lineare: per esempio, raddoppiando il campione non si dimezza l’intervallo di confidenza. -
Percentuale
L’accuratezza dipende anche dalla distribuzione percentuale delle risposte. Per esempio se il 99% del campione risponde “sì” e l’1% “no”, le probabilità di errore sono remote, indipendentemente dalla grandezza del campione. Nel caso invece di risposte che oscillano intorno al 50%, c’è una maggiore possibilità di ottenere dati non verosimili. -
Grandezza della popolazione
Quante persone ci sono nel gruppo che il tuo campione rappresenta? Spesso non si conosce l’esatta grandezza della popolazione, ma questo non è un problema. La statistica dimostra infatti che la grandezza della popolazione è irrilevante, a meno che questo parametro non ecceda di una piccola percentuale la popolazione totale in esame. Per questo motivo il software ignora la grandezza della popolazione quando è ampia o sconosciuta. La grandezza della popolazione è può infatti influire sui risultati solo quando si lavoro con un gruppo relativamente piccolo di persone.
Il calcolo dell’intervallo di confidenza prevede che il campione in esame
sia stato già randomizzato.
Vai alla pagina web del
Sample Size Calculator.