Estimări punct și interval

Dacă estimarea parametru este un singur număr, o astfel de evaluare se numește punctul (un punct de pe axa reală). Estimările considerate mai sus sunt estimări punctuale.

Dacă găsim gama de valori la care adevărata valoare cade cu o anumită probabilitate, atunci o astfel de estimare va fi intervalul. Intervalul corespunzător se numește intervalul de încredere. iar probabilitatea este o probabilitate de încredere (sau fiabilitate).

De exemplu, x este scorul mediu al elevului.

Un exemplu de estimare punct: = 4.5.

Un exemplu de estimare a intervalului: 4.2 ≤ ≤ 4.8 (sau, care este același, = 4.5 ± 0.3) cu o probabilitate de 0.93. Un alt exemplu de estimare a intervalului: 4.1 ≤ ≤ 4.9 cu o probabilitate de 0.95 (adică = 4.5 ± 0.4).

Trebuie remarcat faptul că cu cât este mai mare nivelul de încredere, cu atât este mai mare intervalul de încredere. De fapt, în exemplul de mai sus, chiar și fără a cunoaște valoarea medie, este posibil să se spună exact (cu probabilitatea 1) astfel încât 2 ≤ ≤ 5, ca și celelalte valori din această scală de evaluare luate în general, nu se poate. Cu toate acestea, astfel de informații sunt în mod evident inutile pentru cercetător. Cu cât intervalul de încredere este mai mic, cu atât probabilitatea de eroare este mai mare, i. E. faptul că nu ajungem în ea (și probabilitatea de încredere, respectiv, este mai mică). Ie estimările mai precise sunt date cu o probabilitate mai mică.

Deci, dacă limitele intervalului de încredere pentru valorile unui anumit parametru A sunt determinate de formula A ±  cu probabilitate de încredere γ, atunci cea mai mare , cu atât mai mare . Pentru a determina utilizarea formulelor, a căror formă depinde de parametrul care este evaluat prin ce metodă și ce tip de eșantionare este utilizat. În plus, atunci când se calculează aceste formule, se utilizează informații despre volumele eșantionului și populația și valoarea valorii. Formulele necesare pot fi găsite în manuale și cărți de referință privind statisticile.

Testarea ipotezelor statistice

O ipoteză statistică este orice presupunere despre forma sau valorile parametrilor unei distribuții de probabilitate.

La testarea ipotezelor statistice, ipoteza care este testată este denumită de obicei ipoteza nulă și este notată de Ho. În același timp, consider ipoteza alternativă (concurentă) H1. Ipotezele H0 și H1 trebuie să fie opuse una față de cealaltă.

Principiul verificării ipotezelor statistice este după cum urmează. Pe baza eșantionului de date, calculam un indicator , care se numește statistica criteriilor. Această rată este o variabilă aleatoare (deoarece este calculat din eșantion), dar este selectat astfel încât distribuția ei de probabilitate este cunoscută (eventual aproximative). În plus, valoarea trebuie să fie legată de îndeplinirea sau nu a ipotezei de testare. Toate posibil znacheniyarazbivayut în două domenii disjuncte este un domeniu ikriticheskuyu domeniu de respingere (care a respins ipoteza). De exemplu, statistica critic selectat kriteriyakr astfel încât dacă ipoteza este corectă, atunci probabilitatea de a depăși această valoare α α = P (> kr) este foarte mică (α = P (> kr)). Apoi, ipoteza este acceptată, iar pentru toate celelalte valori, Ho este respins.

Regula de verificare a unei ipoteze statistice este numită criteriu statistic.

Cu toate acestea, cu probabilitatea α, se poate încă să se facă o eroare (adică, ipoteza lui Ho va fi respinsă, deși este adevărată). Acest lucru se poate întâmpla deoarece valoarea statisticii a intrat accidental în zona critică. O astfel de eroare se numește primul tip de eroare. iar probabilitatea corespunzătoare se numește nivelul de semnificație al criteriului. Ar trebui să fie mic.

În plus, se poate admite și o eroare de tipul celui de-al doilea: constă în acceptarea ipotezei, deși este, în realitate, incorectă (iar ipoteza alternativă H1 este adevărată). Rețineți că atunci când testați aceeași ipoteză pentru un eșantion de același volum, este imposibil să reduceți simultan probabilitatea de eroare a primului și a celui de-al doilea tip. Acest lucru se datorează faptului că, odată cu creșterea regiunii critice, atât α cât și ν cresc simultan. La urma urmei, cu cât este mai mare zona critică, cu atât este mai mare probabilitatea respingerii ipotezei și cu atât este mai puțin probabil să se accepte (probabil, probabilitatea respingerii celui potrivit sau acceptarea celui rău este mai mare). Probabilitatea de a NU admite o greșeală a celui de-al doilea tip se numește capacitatea criteriului (este egală cu 1-β).

În același timp, crește puterea de testare și de a reduce nivelul de semnificație este posibilă numai prin creșterea dimensiunii eșantionului, deoarece numai în aceste condiții, valorile eșantion de indicatori va reflecta mai fidel adevăratele caracteristici ale distribuției, precum și probabilitatea abaterilor aleatorii scad.

De exemplu, depozitul a primit un lot de produse. O parte din articolele pentru testare pentru căsătorie este selectată din aceasta. Pe baza rezultatelor auditului, ipoteza nulă va fi acceptată sau respinsă, după cum urmează: ponderea produselor defecte în lot este mică și partidul poate fi acceptat. Să presupunem mai întâi că în produsele selectate proporția defectului a fost ridicată și, în funcție de rezultatele controlului selectiv, întregul lot a fost respins. Cu toate acestea, este probabil că inspectorul a prins în mod accidental produsele rău și, de fapt, lotul a trebuit să fie acceptat, deoarece restul produselor nu conțin produse defecte. În acest caz, a fost făcută o eroare de primul fel; a respins ipoteza reală nulă (produse bune respinse). Acum, să presupunem că în produsele selectate ponderea defectului a fost mică și, în funcție de rezultatele controlului selectiv, lotul a fost acceptat. Cu toate acestea, este probabil că inspectorul a prins în mod accidental produsele bune, și, de fapt, lotul a trebuit să fie respins. În acest caz, a fost făcută o eroare de tipul celui de-al doilea; Ipoteza nulă greșită este acceptată. Din exemplele prezentate, este evident că cele mai multe elemente vor fi selectate pentru verificare, cu atât riscul este mai mic pentru a le face pe amândouă. Pentru o dimensiune egală a eșantionului, cu cât sunt mai stricte criteriile de verificare (zona mai critică), cu atât este mai mare probabilitatea de a face o greșeală de primul tip și mai puțin a doua eroare (și invers).

În jurisprudență, sub ipoteza nulă, înseamnă de obicei ipoteza că inculpatul este nevinovat. În consecință, greșeala de primul fel este sarcina nevinovată, iar eroarea celui de-al doilea este achitarea vinovată. Stabilirea unui nivel scăzut de semnificație înseamnă că probabilitatea de eroare de primul tip ar trebui să fie mică, adică riscul de a accepta greșitul, "învinovățirea nevinovatului" ar trebui să fie redus.

În funcție de tipul zonei critice, toate criteriile statistice sunt împărțite în trei clase principale. Considerați-le într-un exemplu în care statisticile au o distribuție normală standard (adică = N (0; 1)) și un nivel de semnificație de cinci procente (α = 0,05) este dat:

1) regiunea critică dreaptă este dată de inegalitate

Dacă α = 0,05, atunci aria de sub graficul de densitate al distribuției normale standard în dreapta liniei drepte x = cr ar trebui să fie 0,05. Întreaga zonă de sub acest grafic din dreapta axei verticale este de 0,5. Pentru a găsi valoarea cr. Folosim funcția Laplace, care ar trebui să presupună aici valoarea 0.5-0.05 = 0.45. Această valoare corespunde cr = 1,64.

Estimări punct și interval

În figura 20, suprafața figurii umbrită este de 0,05, adică 5% din unitate (din suprafața totală a graficului sub funcția densității de probabilitate). Aceasta înseamnă că P (> cr) = α = 0,05. Cu o astfel de probabilitate, ipoteza care va fi testată va fi totuși respinsă, chiar dacă este, de fapt, adevărată. Dacă valoarea reală a statisticilor criteriului este ≤cr. ipoteza este acceptată.

2) regiunea critică la stânga este dată de inegalitate

Această valoare corespunde cu cr = -1,64. În figura 21, aria figurului umbrit este de asemenea 0,05; P (<кр ) = α = 0,05. Если фактическое значение статистики критерия≥кр. гипотеза принимается.

Estimări punct și interval

3) regiunea critică cu două laturi este dată de inegalități

Deoarece aria de sub graficul de densitate distribuție în regiunea critică ar trebui să fie 0,05, suprafața fiecăreia dintre cele două zone umbrite din Figura 22 ar trebui să fie 0,025 (adică α / 2). Apoi, funcția Laplace la x = cr2 ar trebui să ia valoarea 0.5-0.025 = 0.475. Această valoare corespunde cu cr2 = 1,96. În consecință, cr1 = -1,96.

Astfel, folosind criteriul cu două fețe P (<кр1 ) = = Р(>cr2) = α / 2. Dacă kr1 ≤≤cr2. ipoteza este acceptată.

Estimări punct și interval

Luați în considerare următorul exemplu. Masina de ambalare condimente Pronunțată a fost ajustată astfel încât greutatea medie de condimente într-o pungă într-un lot de test de 50 de bucăți a fost de 90 = 0 (g) la SKOh = 10 (g). De la o lună lot preambalat a fost selectat saci de 60, iar greutatea medie de condimente într-o pungă sostavila0 = 86 (g) la SKOy = 8,5 (g). Este necesar să aflați dacă aceasta este o coincidență accidentală sau dacă mașina este defectată.

Să formulăm ipoteza nulă: ajustarea nu este ruptă. Aceasta înseamnă că, de fapt, valorile medii pentru livrare și sunt în prezent egale, adică M (-) = M () - M () = 0. Vom presupune că variabila aleatoare are o distribuție normală cu așteptare matematică 0.

Să găsim RMS-ul acestei variabile aleatorii.

Este variația variabilei aleatoare? D () = D ((xi) / n)) = = (D (xi)) / 2 = (D (xi)) / 2 =  x 2 * n / n 2 =  2 x / n, unde n = 50, adică D () = 100/50 = 2.

În mod similar, D () =  2 y / n, unde n = 60, adică D () = 8,5 2/60 = 72,25 / 601,2.

Apoi, D (-) = D () + D () = 3,2 și CCE este 1,79.

Apoi, statistica  = (-) / 1,79 va avea o distribuție normală standard, adică,  = N (0, 1). Luând ca estimare media generală, eșantionul estimează 0 și 0. calculați valoarea reală a statisticilor criteriului:  = () / 1,792,23.

Atribuiți un nivel de semnificație de 5%. Noi construim o regiune critică cu două fețe, dacă criteriul real devine în ea, înseamnă că diferența dintre media prea este semnificativ diferită de zero în orice direcție; și apoi ipoteza egalității mijloacelor ar trebui respinsă. Prin tabelul de funcții Laplace descoperim limitele acestei regiuni: F (kr2) = 0,5 - 0.05 / 2 = 0,475, togdakr2 = 1.96; kr1 = -1.96. Din moment ce 2.23> 1.96, ipoteza H0 este respinsă, adică reglarea mașinii este întreruptă. Cu toate acestea, există o probabilitate de cinci la sută că concluzia făcută din întâmplare (de exemplu, de fapt, cu masina bine, doar o prelevare de probe de rău au fost făcute).

Alocați un nivel de semnificație de 2%. Apoi găsim regiunea critică a tabelului funcției Laplace pentru valorile de margine ale acestei funcții (kr2) = 0,5 - 0.02 / 2 = 0,49, atunci togdakr2 = 2.34; kr1 = -2.34. De la 2.23> 2.34, o ipoteză nulă poate fi adoptată la nivelul de 2% de semnificație. Ie presupuneți că ajustarea mașinii nu este întreruptă.

Articole similare