Vienfaktorinės disperinės analizės taikymas

ANOVA taikymo schema:

1. Duomenys. Turime k imčių (x_{11}, ..., x_{1n_1}), ..., (x_{k1}, ..., k_{kn_k}), gautų matuojant nepriklausomus normaliuosius atsitiktinius dydžius X_{1}\sim N(\mu _{1},\sigma ^2), ..., X_{k}\sim N(\mu _{k},\sigma ^2) pagal intervalų skalę. Nei vidurkių \mu_1, ..., \mu_k , nei dispersijos \sigma^2 nežinome.

2. Statistinė hipotezė.

\left\{\begin{matrix}H_0: \mu_1=...=\mu_k\\ H_1: bent\:du\:vidurkiai\: skiriasi\end{matrix}\right.

3. Kriterijaus statistika. Skaičiuojame:

F=\frac{MSB}{MSW},

kai MSB=\frac{n_1(\overline{X}_1-\overline{X})^2+...+n_k(\overline{X}_k-\overline{X})^2}{k-1}

ir    MSW=\frac{(n_1-1)S_1^2+...+(n_k-1)S_k^2}{n_1+...+n_k-k}

4. Sprendimo priėmimo taisyklė. Reikšmingumo lygmuo lygus \alpha. Hipotezė H_0 atmetama (bent du vidurkiai statistiškai reikšmingai skiriasi), jei F>F_{\alpha}(k-1,N-k) ; čia N=n_1+...+n_k, F_{\alpha}(k-1,N-k) yra Fišerio skirstinio su k-1 ir N-k laisvės laipsnių \alpha lygmens kritinė reikšmė. Hipotezę H_0 priimame, jei F\leq{F_{\alpha}(k-1,N-k)}

Pavyzdys.

Gamykloje yra keturių rūšių staklės. Žinoma, kiek mėnesių praėjo nuo kiekvienų staklių darbo pradžios iki pirmojo gedimo. Ar duomenys leidžia teigti, kad ne visų rūšių staklės genda vienodai greitai?

(\alpha=0,05).

Staklių rūšis A B C D
Laikas 36 35 35 36,5
iki 30,2 36 30,6 30,3
pirmojo 33,3 34,5 33,7 30
gedimo 35,1 33,9 37,1 33,6
(mėn) 33,9 36,5
n_i 5 4 4 5 N=18
T_i 167,5 139,4 136,4 166,9 T=610,2
\bar{x_i} 33,5 34,85 34,1 33,28 \bar{x}=33,85
\sum {x_i^2} 5631,35 4860,46 4673,46 5611,55 \sum{x_{ij}^2=}20776,82

Viršuje pateikti duomenys ir apskaičiuoti reikalingi dydžiai. Sudarome hipotezę:

\left\{\begin{matrix}H_0:\:vidutiniai\:laikai\:nesiskiria\\ H_1:\:vidutiniai\:laikai\:skiriasi\end{matrix}\right..

Dabar randame:

\frac{T_1^2}{5}+\frac{T_2^2}{4}+\frac{T_3^2}{4}+\frac{T_4^2}{5}=20691,7;

SSB=\sum{i=1}{k}{\frac{T_i^2}{n_i}}-\frac{T^2}{N}=20691,7-20685,78=5,92

SSW=20776,82-20691,7=85,12

SST=20776,82-20685,78=91,04, k-1=4-1=3, N-k=18-4=14

MSB=\frac{SSB}{k-1}=1,97,       MSW=\frac{SSW}{N-k}=6,08

Tada

F=\frac{MSB}{MSW}=0,32

Kadangi F=0,32<3,34=F_{0,05}(3,14), tai atmesti nulinės hipotezės negalima. Turimi duomenys leidžia teigti, kad visų rūšių staklių vidutiniai laikai iki pirmojo sugedimo statistiškai reikšmingai nesiskiria.

Pastaba.

Hipotezės priėmimą galime taikyti ir p -reikšmei.

Sakykime, kad turime tą pačią hipotezę, tada priėmimo taisyklę formuluotumėme taip: sakykime, kad reikšmingumo lygmuo yra lygus \alpha.Tada

H_0 atmetama, jei p<\alpha

H_0 priimama, jei p\geq{\alpha}

Reklama

Žymos:

Parašykite komentarą

Įveskite savo duomenis žemiau arba prisijunkite per socialinį tinklą:

WordPress.com Logo

Jūs komentuojate naudodamiesi savo WordPress.com paskyra. Atsijungti / Keisti )

Twitter picture

Jūs komentuojate naudodamiesi savo Twitter paskyra. Atsijungti / Keisti )

Facebook photo

Jūs komentuojate naudodamiesi savo Facebook paskyra. Atsijungti / Keisti )

Google+ photo

Jūs komentuojate naudodamiesi savo Google+ paskyra. Atsijungti / Keisti )

Connecting to %s


%d bloggers like this: