Chi-Quadrato, T-Student e F
Dalla distribuzione normale utilizzate per confrontare varianze, medie e indipendenza tra dati.
Distribuzione Chi-Quadrato (χ²)
La distribuzione Chi-Quadrato è utilizzata per test di indipendenza tra variabili e per verificare la bontà di adattamento di un modello ai dati.È definita come la somma dei quadrati di variabili casuali normali standardizzate.
Esempio d'uso
test Chi-Quadrato per verificare se due variabili categoriali sono indipendenti.
Python Distribuzione Chi-Quadrato
Utilizzata per il **test di indipendenza** tra variabili categoriali.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import chi2
# Gradi di libertà
df = 5
x = np.linspace(0, 20, 100)
y = chi2.pdf(x, df)
# Grafico
plt.plot(x, y, label=f'Chi-Quadrato (df={df})', color='blue')
plt.xlabel("Valori")
plt.ylabel("Densità di Probabilità")
plt.title("Distribuzione Chi-Quadrato")
plt.legend()
plt.show()
verifica se esiste una relazione tra due variabili categoriali (es. genere e preferenza di un prodotto).
Distribuzione T-Student
La distribuzione T-Student è simile alla normale ma con code più larghe. È usata quando il campione è piccolo (\(n < 30\)) e la varianza della popolazione è sconosciuta.Esempio d'uso
confronto tra le medie di due campioni quando la varianza è sconosciuta (test t di Student).
Python Distribuzione T-Student
Utilizzata per il **confronto tra medie di due gruppi** con varianza sconosciuta.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import t
# Gradi di libertà
df = 10
x = np.linspace(-5, 5, 100)
y = t.pdf(x, df)
# Grafico
plt.plot(x, y, label=f'T-Student (df={df})', color='red')
plt.xlabel("Valori")
plt.ylabel("Densità di Probabilità")
plt.title("Distribuzione T-Student")
plt.legend()
plt.show()
confronto tra il punteggio medio di due classi in un esame.
Distribuzione F
La distribuzione F è utilizzata per confrontare le varianze di due popolazioni ed è fondamentale nei test ANOVA per confrontare più di due gruppi.Esempio d'uso
test F per verificare se due varianze sono uguali.
Python Distribuzione F
Utilizzata per il confronto tra varianze (es. test ANOVA).
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import f
# Gradi di libertà
df1, df2 = 5, 10
x = np.linspace(0, 5, 100)
y = f.pdf(x, df1, df2)
# Grafico
plt.plot(x, y, label=f'F (df1={df1}, df2={df2})', color='green')
plt.xlabel("Valori")
plt.ylabel("Densità di Probabilità")
plt.title("Distribuzione F")
plt.legend()
plt.show()
confronto tra la variabilità di più gruppi in un esperimento.