Uždavinys su Stjudento kriterijumi nepriklausomoms imtims

lapkričio 7, 2009

Sąlyga:

Atliktas eksperimentas: firmos darbuotojus atsitiktinai padalino į dvi grupes, iš jų vienai buvo nežymiai padidintas atlyginimas. Per 15 darbo dienų pirmoje grupėje, kuriai atlyginimas nebuvo keltas, padirbta 10, 12, 13, 11, 9, 10, 14, 12, 11, 10, 9, 13, 15, 11, 12 dalių, o antroje grupėje padirbta 11, 10, 13, 15, 17, 10, 6, 14, 15, 12, 11, 15, 14, 12, 10. Ar darbo našumas padidėjo toje grupėje, kurioje atlyginimas buvo pakeltas? Laikykime, kad reikšmingumo lygmuo \alpha=0,05

Sprendimas:

Formuojame statistinę hipotezę

CodeCogsEqn

Susirandame imčių vidurkius: \bar{x}=11,4667, \bar{y}=12,3333, imties plotis abiem atvejais: n=m=15, susirandame dispersijas: s_x^2=2,7333, s_y^2=6,8333.

Skaičiuojame

t=\frac{\bar{x}-\bar{y}}{\sqrt{(n-1)s_x^2+(m-1)s_y^2}}\sqrt{\frac{nm(n+m-2)}{n+m}}\approx 1,0852

Kadangi t=1,0852<t_{\frac{\alpha}{2}}(n+m-2)=1,708, tai reiškia, kad H_0:\mu_X=\mu_Y neatmetame. Darome išvadą, kad atlyginimo didinimas darbo našumo nepadidina.

11,46667

Entropijos sąvoka

lapkričio 7, 2009

Intuityviai aišku, kad kai kuriuose atsitiktiniuose dydžiuose atsitiktinumo yra daugiau nei kituose.  Palyginkime du atsitiktinius dydžius X ir Y.

X 0 1
P 0,5 0,5

 

Y 0 1
P 0,999 0,001

Abu jie įgyja vienodas reikšmes – nulį ir vienetą. Tačiau (prisiminkime statistinį tikimybės apibrėžimą) daug kartų stebint X, nulių ir vienetų bus maždaug po lygiai (reikšmių tikimybės yra lygios), o daug kartų stebint Y, beveik visuomet gausime vienetą (nulio tikimybė yra labai maža). Aišku, kad Y atsitiktinumas skiriasi nuo X atsitiktinumo. Skaitinis matas, parodantis atsitiktinio dydžio atsitiktinumo lygmenį, vadinamas entropija.

Atsitiktinio dydžio X entropija

H=-\sum_{i}p_i\ln{p_i}, jei X diskretus;

H=-\int_{-\infty }^{\infty }p(x)\ln{p(x)}dx, jei X absoliučiai tolydus.

Čia p(x)\ln{p(x)}=0, kai p(x)=0. Apskaičiavę minėtų dydžių X ir Y entropijas, gauname H_X=0,693, H_X=0,0069. Jeigu X įgyja reikšmes x_1,x_2,...,x_n su tikimybėmis p_1,p_2,...,p_n, taiX entropija yra didžiausia, kai p_1=p_2=...=p_n=\frac{1}{n}, o mažiausia, kai viena tikimybė lygi 1, o kitos lygios 0.

 

\sum_{i}p_i\ln{p_i}

Bernulio schema

lapkričio 7, 2009

Bernulio eksperimentų schema nusakoma šitaip: eksperimentą atlikus vieną kartą, jo sėkmės tikimybė lygi p. Atliekame n nepriklausomų eksperimentų. Kokia tikimybė, kad eksperimentas pavyks k kartų? Laikykime, kad P = P ( k sėkmingų bandymų iš n ), tada

P=\binom{n}{k}p^k(1-p)^{n-k}

Įrodymas:

Pasinaudoję priešingo įvykio tikimybe, gauname, kad bandymą atliekant vieną kartą,  jis nepavyks su tikimybe 1-p. Sėkmingą bandymą pažymėkime raide S, o nesėkmingą N (P(S)=p, P(N)=1-p). Ieškomoji tikimybė

P(SSS...SNNN...N\cup SSS...SNSNNN...\cup ...)=

=P(SSS...SNNN...N)+P(SSS...SNSNNN...)+...=

=P(S)...P(S)P(N)...P(N)+P(S)...P(S)P(N)P(S)P(N)...P(N)+=

=p^k(1-p)^{n-k}+p^k(1-p)^{n-k}+...+p^k(1-p)^{n-k}

Kiekvieno palankaus įvykio tikimybė ta pati ir lygi p^k(1-p)^{n-k}. Kiek tokių įvykių yra iš viso? Jų tiek, kiek būtų iš n eksperimentų gauti k sėkmingų, t.y. \binom{n}{k}. Taigi, įrodėme šią formulę.

Iliustruokime tai pavyzdžiu:

Studentas gavo 10 klausimų klausimyną. Atsakymą į kiekvieną klausimą reikia parinkti iš 4 galimų variantų, iš kurių tik vienas teisingas. Testas parašytas runomis pietinių zulusų dialektu. Studentas atsakymą renkasi atsitiktinai. Kokia tikimybė, kad jis teisingai atsakys į 3 klausimus?

Studentas 10 kartų kartoja bandymą – atsitiktinai renka atsakymą iš 4 galimų variantų. Vieno bandymo sėkmės tikimybė yra \frac{1}{4}=0,25. Ieškomoji tikimybė:

\binom {10}{3}(0,25)^3(1-0,25)^7=0,25028....

Pastaba:

Pastebime, kad Bernulio schemoje vienas bandymas galėjo tik pavykti arba nepavykti. Tokia schemą galima apibendrinti ir esant k skirtingų baigčių. Tarkime, kad vieną kartą darant bandymą baigčių tikimybės yra p_1, p_2,...,p_k (žinoma, kad p_1+p_2+...+p_k=1). Tuomet tikimybė, kad po n bandymų bus m_1 pirmųjų baigčių, m_2 antrųjų baigčių, …, m_k k-tųjų baigčių (m_1+m_2+...+m_k=n), yra lygi

P(m_1, m_2,...,m_k)=\frac{n!}{m_1!m_2!...m_k!}p^{m_1}p^{m_2}...p^{m_k}.

Uždavinys su tarpusavio sutapimo rodikliu

lapkričio 7, 2009

Sąlyga.

Pateikiame tyrimo rezultatus:

Geria kavą Negeria kavos Iš viso
Moterys 4632     (a) 453      (b) 5085 (a+b)
Vyrai 3421      (c) 1983    (d) 5404 (c+d)
Iš viso 8053     (a+c) 2436    (b+d) 10489  (n)

Skaičiuosime tarpusavio sutapimo rodiklį.

Sprendimas:

\phi=\sqrt{\frac{\chi^2}{n}}=\frac{\left | ad-bc \right |}{\sqrt{(a+b)(c+d)(b+d)(a+c)}}

Statykimės duomenis:

\phi=\frac{\left | 4632\cdot 1983-435\cdot 3421 \right |}{\sqrt{8053\cdot5404\cdot2436\cdot5085}}\approx 0,33

Paskaičiuokime \phi_{adj}:

\phi_{adj}=\frac{\phi}{\left | \phi \right |_{max}}

\phi_{max}=\frac{\sqrt{p_{min}(1-p_{max})}}{\sqrt{p_{max}(1-p_{min})}}

p_{max}=\frac{\max{(\min{(a+b, c+d)},\min{(a+c, b+d)})}}{n}=0,485

p_{min}=\frac{\min{(\min{(a+b, c+d)},\min{(a+c, b+d)})}}{n}=0,232

\phi_{max}=\frac{\sqrt{0,232(1-0,485)}}{\sqrt{0,485(1-0,232)}}=0,565

\phi_{adj}=\frac{0,33}{0,565}=0,584

Hipergeometrinis skirstinys

lapkričio 7, 2009

Turime N objektų, iš kurių M žymėti. atsitiktinai parenkame n objektų. Iš jų žymėtų objektų skaičius yra atsitiktinis dydis, turintis hipergeometrinį skirstinį. Hipergeometrinis skirstinys žymimas X \sim H (N, M, n). Jo tikimybės nusakomos formule

P(X=k)=\frac{\binom {M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}

\max{(o,M+n-N)}\leq k\leq \min{(M,n)}

Skaitinės charakteristikos

EX=\frac{nM}{N}        DX=\frac{nM(N-M)(N-n)}{N^2(N-1)}

Pavyzdys

Loterijoje tarp 60 skaičių yra 20 laimingų. Žaidėjas spėja 15 skaičių. Jeigu atspėja 5 skaičius, gauna a sumą pinigų, jei 6 – b sumą pinigų ir panašiai. Tarkime, kad X yra atspėtų laimingųjų skaičius, o Y – laimėta pinigų suma. Nesunku pastebėti, kad X \sim H (60, 20, 15), o tikimybė

P(X=k)=\frac{\binom {20}{k}\binom{40}{15-k}}{\binom{60}{15}}.

Statistinės charakteristikos bus tokios:

EX=\frac{15\cdot20}{60}=5        DX=\frac{15\cdot20(60-20)(60-15)}{60^2(60-1)}\approx 2,542

Pastaba.

Y nėra pasiskirstęs pagal hipergeometrinį skirstinį. Vidutinis išlošis yra

EY=aP(Y=a)+bP(Y=b)+...,

čia P(Y=a), P(Y=b) yra tikimybės, su kuriomis Y įgyja reikšmes a ir b.

Didžiausio tikėtinumo metodas

lapkričio 7, 2009

Didžiausio tikėinumo metodą pirmiausia aptarsime tolydžiųjų atsitiktinių dydžių atveju. Tarkime, stebime atsitiktinį dydį X, kurio tankis p_{\theta} priklauso nuo nežinomo vienamačio parametro \theta. Tikėtinumo funkcija sudaroma taip:

L_{\theta}=p_{\theta}(X_1)p_{\theta}(X_2)...p_{\theta}(X_n).

Taigi tankio funkcijoje vietoje argumento iš eilės įstatome X_1,X_2,...,X_n. Ieškome tokio \theta, kuris maksimizuotų funkciją L_{\theta}. Dažniausiai tai daroma taip:

  1. Randame \ln{L_{\theta}};
  2. apskaičiuojame \ln{L_{\theta}} išvestinę pagal \theta: (\ln{L_{\theta}})';
  3. prilyginame rastą išvestinę nuliui (\ln{L_{\theta}})'=0 ir gautą išvestinę sprendžiame \theta atžvilgiu;
  4. gautą rezultatą \hat{\theta} laikome \theta įverčiu.

Pavyzdys:

Stebime X \sim N(\mu,1). Didžiasio tikėtinumo metodu įvertinkime \mu. Nagrinėjamu atveju X tankis

p_{\mu}(x)=\frac{1}{\sqrt{2\pi}}\exp{\{-\frac{(x-\mu)^2}{2}\}}

Todėl

L_{\mu}=\frac{1}{\sqrt{2\pi}}\exp{\{-\frac{(X_1-\mu)^2}{2}\}}\frac{1}{\sqrt{2\pi}}\exp{\{-\frac{(X_2-\mu)^2}{2}\}}...\frac{1}{\sqrt{2\pi}}\exp{\{-\frac{(X_n-\mu)^2}{2}\}}=

=(\frac{1}{\sqrt{2\pi}})^n\exp{\{-\frac{1}{2}((X_1-\mu)^2+(X_2-\mu)^2+...+(X_n-\mu)^2)\}}

Logaritmuojame L_{\mu}:

\ln{L_{\mu}}=-n\ln{\sqrt{2\pi}}-\frac{1}{2}((X_1-\mu)^2+(X_2-\mu)^2+...+(X_n-\mu)^2).

Randame išvestinę pagal \mu:

(\ln{L_{\mu}})'=(X_1+X_2+...+X_n)-n\mu.

Gautą reiškinį prilyginame nuliui ir išsisprendžiame \mu atžvilgiu.

\mu=\frac{X_1+X_2+...+X_n}{n}=\bar{X}.

Taigi ieškomas įvertis \hat{\mu}=\bar{X}

Pastaba: Jei turine k-matį dydį \theta=(\theta_1,\theta_2,...,\theta_k), tai randame dalines \ln{L_{\theta}} išvestines pagal \theta_1,\theta_2,...,\theta_k. Jos prilyginame nuliui ir sprendžiam k-matę lygčių sistemą:

\left\{\begin{matrix}\frac{\partial L}{\partial \theta_1}=0,\\...\\\frac{\partial L}{\partial \theta_k}=0.\end{matrix}\right.

Gauti \hat{\theta_1},\hat{\theta_2},...,\hat{\theta_k} laikomi ieškomais įverčiais.

Hello world!

lapkričio 6, 2009

Welcome to WordPress.com. This is your first post. Edit or delete it and start blogging!