Introduzione

1. Cosa significa

La sampling distribution (distribuzione campionaria) è la distribuzione di una statistica calcolata da molti campioni estratti dalla stessa popolazione.

In altre parole: prendi tanti campioni dalla popolazione, calcoli ogni volta una statistica (es. media), poi guardi come variano quei valori.


2. Esempio concreto

Immagina che la popolazione sia formata da tutti gli stipendi di 1 milione di lavoratori italiani.

  • La vera media (μ) esiste, ma non la conosci.

  • Prendi un campione di 50 persone, calcoli la media degli stipendi → ottieni la prima stima.

  • Poi prendi un altro campione di 50, calcoli la media → ottieni un’altra stima.

  • Ripeti questa operazione 1.000 volte.

Se si disegna un grafico di tutte le medie ottenute, quello è la distribuzione campionaria della media.


3. Perché è importante

La sampling distribution serve a:

  • Capire quanto varia una statistica da campione a campione.

  • Calcolare l’errore standard (quanto la statistica è “incerta”).

  • Fare inferenza statistica (es. intervalli di confidenza, test di ipotesi).


4. Caratteristiche chiave

  • Media della distribuzione campionaria ≈ media vera della popolazione (μ).

  • Varianza → dipende dalla varianza della popolazione e dalla dimensione del campione.

  • Legge dei grandi numeri: aumentando la dimensione del campione, la distribuzione campionaria diventa più stretta.

  • Teorema del limite centrale: se il campione è abbastanza grande, la distribuzione campionaria tende ad essere normale, anche se la popolazione non lo è.

Last updated