Introduzione
1. Cosa significa
La sampling distribution (distribuzione campionaria) è la distribuzione di una statistica calcolata da molti campioni estratti dalla stessa popolazione.
In altre parole: prendi tanti campioni dalla popolazione, calcoli ogni volta una statistica (es. media), poi guardi come variano quei valori.
2. Esempio concreto
Immagina che la popolazione sia formata da tutti gli stipendi di 1 milione di lavoratori italiani.
La vera media (μ) esiste, ma non la conosci.
Prendi un campione di 50 persone, calcoli la media degli stipendi → ottieni la prima stima.
Poi prendi un altro campione di 50, calcoli la media → ottieni un’altra stima.
Ripeti questa operazione 1.000 volte.
Se si disegna un grafico di tutte le medie ottenute, quello è la distribuzione campionaria della media.
3. Perché è importante
La sampling distribution serve a:
Capire quanto varia una statistica da campione a campione.
Calcolare l’errore standard (quanto la statistica è “incerta”).
Fare inferenza statistica (es. intervalli di confidenza, test di ipotesi).
4. Caratteristiche chiave
Media della distribuzione campionaria ≈ media vera della popolazione (μ).
Varianza → dipende dalla varianza della popolazione e dalla dimensione del campione.
Legge dei grandi numeri: aumentando la dimensione del campione, la distribuzione campionaria diventa più stretta.
Teorema del limite centrale: se il campione è abbastanza grande, la distribuzione campionaria tende ad essere normale, anche se la popolazione non lo è.
Last updated