După cum sa menționat în secțiunea anterioară, studiul algoritmilor clasici în multe cazuri poate fi efectuat folosind metode asimptotice de statistică matematică, în special folosind CLT și metodele de moștenire a convergenței. Separarea statisticii matematice clasice de nevoile cercetării aplicate se manifestă, în special, prin faptul că monografiilor larg răspândite le lipsește aparatul matematic necesar, în special, pentru studiul statisticii cu două eșantioane. Ideea este că trebuie să mergeți la limită nu cu un parametru, ci cu doi - volumele a două mostre. A trebuit să dezvoltăm o teorie adecvată - teoria moștenirii convergenței, prezentată în monografia noastră.

Cu toate acestea, rezultatele unui astfel de studiu vor trebui aplicate cu dimensiuni finite ale eșantionului. Există o mulțime de probleme asociate cu o astfel de tranziție. Unele dintre ele au fost discutate în legătură cu studiul proprietăților statisticilor construite din eșantioane din distribuții specifice.

Cu toate acestea, atunci când se discută impactul abaterilor de la ipotezele inițiale asupra proprietăților procedurilor statistice, apar probleme suplimentare. Ce abateri sunt considerate tipice? Ar trebui să ne concentrăm pe cele mai „dăunătoare” abateri care distorsionează cel mai mult proprietățile algoritmilor sau ar trebui să ne concentrăm pe abaterile „tipice”?

Cu prima abordare, obținem un rezultat garantat, dar „prețul” acestui rezultat poate fi prea mare. Ca exemplu, să subliniem inegalitatea universală Berry-Esseen pentru eroarea din CLT. subliniază pe bună dreptate A.A. Borovkov că „viteza de convergență în problemele reale, de regulă, se dovedește a fi mai bună”.

Cu a doua abordare, se pune întrebarea care abateri sunt considerate „tipice”. Puteți încerca să răspundeți la această întrebare analizând cantități mari de date reale. Este destul de firesc ca răspunsurile diferitelor grupuri de cercetare să difere, după cum se vede, de exemplu, din rezultatele prezentate în articol.

Una dintre ideile false este de a folosi doar o anumită familie parametrică atunci când se analizează posibilele abateri - distribuțiile Weibull-Gnedenko, familia cu trei parametri a distribuțiilor gamma etc. În 1927, Acad. Academia de Științe a URSS S.N. Bernstein a discutat despre eroarea metodologică de reducere a tuturor distribuțiilor empirice la familia Pearson cu patru parametri. Cu toate acestea, metodele parametrice de statistică sunt încă foarte populare, în special în rândul oamenilor de știință aplicați, iar vina pentru această concepție greșită revine în primul rând profesorilor de metode statistice (a se vedea mai jos, precum și articolul).

15. Selectarea unuia dintre multele criterii pentru a testa o ipoteză specifică

În multe cazuri, au fost dezvoltate multe metode pentru a rezolva o problemă practică specifică, iar un specialist în metode de cercetare matematică se confruntă cu problema: care ar trebui să fie oferită savantului aplicat pentru analiza unor date specifice?

Ca exemplu, luați în considerare problema testării omogenității a două eșantioane independente. După cum știți, pentru a o rezolva, puteți oferi o mulțime de criterii: Student, Cramer-Welch, Lord, chi-pătrat, Wilcoxon (Mann-Whitney), Van der Waerden, Savage, N.V. Smirnov, tip omega-pătrat (Lehman -Rozenblatt), G.V Martynov, etc. Pe care să-l aleg?

Ideea de „vot” vine în mod firesc în minte: să verificați în funcție de multe criterii și apoi să luați o decizie „prin vot majoritar”. Din punctul de vedere al teoriei statistice, o astfel de procedură duce pur și simplu la construirea unui alt criteriu, care a priori nu este mai bun decât precedentul, dar mai greu de studiat. Pe de altă parte, dacă soluțiile coincid conform tuturor criteriilor statistice considerate bazate pe principii diferite, atunci, în conformitate cu conceptul de stabilitate, aceasta crește încrederea în soluția generală rezultată.

Există o opinie larg răspândită, mai ales în rândul matematicienilor, falsă și dăunătoare despre necesitatea căutării unor metode, soluții optime etc. Cert este că, de obicei, optimitatea dispare atunci când devii de la premisele inițiale. Astfel, media aritmetică ca estimare a așteptării matematice este optimă doar atunci când distribuția inițială este normală, în timp ce este întotdeauna o estimare validă, atâta timp cât așteptarea matematică există. Pe de altă parte, pentru orice metodă aleasă în mod arbitrar de estimare sau testare a ipotezelor, este de obicei posibil să se formuleze conceptul de optimitate în așa fel încât metoda în cauză să devină optimă - din acest punct de vedere special ales. Să luăm, de exemplu, mediana eșantionului ca o estimare a așteptărilor matematice. Este, desigur, optim, deși într-un sens diferit față de media aritmetică (optimă pentru o distribuție normală). Și anume, pentru distribuția Laplace, mediana eșantionului este estimarea de maximă probabilitate, și deci optimă (în sensul specificat în monografie).

Criteriile de omogenitate au fost analizate în monografie. Există mai multe abordări naturale pentru compararea criteriilor - bazate pe eficiența relativă asimptotică conform lui Bahadur, Hodges-Lehman, Pitman. Și s-a dovedit că fiecare criteriu este optim având în vedere alternativa corespunzătoare sau distribuția adecvată pe setul de alternative. În acest caz, calculele matematice folosesc de obicei alternativa de schimbare, care este relativ rară în practica analizării datelor statistice reale (în legătură cu testul Wilcoxon, această alternativă a fost discutată și criticată de noi în). Rezultatul este trist – tehnica matematică genială demonstrată în nu ne permite să dăm recomandări pentru alegerea unui criteriu de testare a omogenității la analiza datelor reale. Cu alte cuvinte, din punctul de vedere al muncii lucrătorului aplicației, i.e. analiza datelor specifice, monografia este inutilă. Strălucirea măiestrie a matematicii și enorma diligență demonstrată de autorul acestei monografii, din păcate, nu au adus nimic în practică.

Desigur, fiecare statistician care lucrează practic, într-un fel sau altul, rezolvă singur problema alegerii unui criteriu statistic. Pe baza mai multor considerații metodologice, am ales criteriul omega-pătrat (Lehman-Rosenblatt), care este în concordanță cu orice alternativă. Cu toate acestea, rămâne un sentiment de nemulțumire din cauza lipsei de justificare a acestei alegeri.

teză

Prin urmare, una dintre modalitățile de dezvoltare a testării ipotezelor statistice a fost calea construcției „empirice” a criteriilor, când statisticile construite ale criteriului se bazează pe un anumit principiu, o idee ingenioasă sau bunul simț, dar optimitatea acestuia nu este garantat. Pentru a justifica utilizarea unor astfel de statistici la testarea ipotezelor față de o anumită clasă de alternative, cel mai adesea prin...

  • 1. Informații de sprijin
    • 1. 1. Informații din teoria statisticilor C/- și V
    • 1. 2. Definiția și calculul eficienței Bahadur
    • 1. 3. Pe abateri mari ale statisticilor II și V
  • 2. Criteriile de simetrie Baringhouse-Hentze
    • 2. 1. Introducere
    • 2. 2. Statistici
    • 2. 3. Statistici
  • 3. Criterii de exponentialitate
    • 3. 1. Introducere
    • 3. 2. Statistica I
    • 3. 3. Statistica n
  • 4. Criterii de normalitate
    • 4. 1. Introducere
    • 4. 2. Statistica B^
    • 4. 3. Statistica V^n
    • 4. 4. Statistica V|)P
  • 5. Criterii de acord cu legea lui Cauchy
    • 5. 1. Introducere
    • 5. 2. Statistici
    • 5. 3. Statistici

Proprietățile asimptotice ale simetriei și criteriile de acord bazate pe caracterizări (eseu, cursuri, diploma, test)

Această teză construiește și studiază criteriile de bunătate și simetrie bazate pe proprietățile de caracterizare ale distribuțiilor și, de asemenea, calculează eficiența relativă asimptotică a acestora pentru un număr de alternative.

Construirea criteriilor statistice și studiul proprietăților lor asimptotice este una dintre cele mai importante sarcini statistici matematice. Când se testează o ipoteză simplă față de o alternativă simplă, problema este rezolvată folosind lema Neyman-Pearson, care, după cum se știe, dă criteriul optim (cel mai puternic) din clasa tuturor criteriilor unui anumit nivel. Acesta este testul raportului de probabilitate.

Cu toate acestea, pentru problemele de testare a ipotezelor mai dificile și practice care implică fie testarea ipotezelor complexe, fie luarea în considerare a alternativelor complexe, testele cele mai puternice în mod uniform există rareori, iar rolul testului raportului de probabilitate se schimbă semnificativ. Statistica raportului de probabilitate nu poate fi calculată în mod explicit, își pierde proprietatea de optimitate, iar distribuția sa este instabilă la modificările modelului statistic. Mai mult, de multe ori statisticianul nu poate determina deloc tipul de alternativă, fără de care construcția criteriilor parametrice devine lipsită de sens.

Prin urmare, una dintre modalitățile de dezvoltare a testării ipotezelor statistice a fost calea construcției „empirice” a criteriilor, atunci când statisticile construite ale criteriului se bazează pe un anumit principiu, o idee ingenioasă sau bunul simț, dar optimitatea acestuia nu este garantat.

Exemple tipice de astfel de statistici sunt statistica semnelor, statistica lui Pearson x2 (1900), statistica Kolmogorov (1933), care măsoară distanța uniformă dintre funcția de distribuție empirică și cea adevărată, coeficientul de corelație a rangului Kendall (1938) sau Bickel- Statistica Rosenblatt (1973), bazată pe riscul pătratic al evaluării densității nucleare. În prezent, statistica matematică are multe zeci de statistici „empirice” pentru testarea ipotezelor de concordanță, simetrie, omogenitate, aleatorie și independență, iar în literatura de specialitate se propun tot mai multe statistici de acest tip. O vastă literatură este dedicată studiului distribuțiilor lor exacte și limită, estimărilor ratei de convergență, abaterilor mari, expansiunilor asimptotice etc.

Pentru a justifica utilizarea unor astfel de statistici la testarea ipotezelor față de o anumită clasă de alternative, puterea lor este cel mai adesea calculată folosind modelarea statistică. Cu toate acestea, pentru orice criteriu consistent, puterea tinde spre unitate pe măsură ce dimensiunea eșantionului crește și, prin urmare, nu este întotdeauna informativă. Analiză mai profundă proprietăți comparative statisticile pot fi efectuate pe baza conceptului de eficiență relativă asimptotică (ARE). Diverse abordări ale calculului AOE au fost propuse de E. Pitman, J. Hodges și E. Lehman, R. Bahadur, G. Chernov și W. Kallenberg la mijlocul secolului XX, rezultatele dezvoltării teoriei AOE la mijlocul secolului; Anii 90 au fost rezumați în monografie. Există o opinie general acceptată conform căreia sinteza noilor criterii ar trebui să fie însoțită nu numai de o analiză a proprietăților acestora, ci și de calculul AOE pentru a evalua calitatea acestora și a oferi recomandări informate pentru utilizarea lor în practică.

Această lucrare folosește ideea de a construi criterii bazate pe caracterizarea distribuțiilor prin proprietatea echidistribuției. Teoria caracterizării provine din lucrarea lui D. Polya, publicată în 1923. Apoi a fost dezvoltată în lucrările lui I. Martsinkevich, S. N. Bernstein, E. Lukach, Yu V. Linnik, A.A. Cântăreț, J. Darmois, V.P. Skitovich, S.R. Pao, A.M. Kagan, J. Galambos, S. Kotz, L. B. Klebanov și mulți alți matematicieni. Literatura de specialitate pe acest subiect este mare, iar în prezent există mai multe monografii dedicate caracterizărilor, de exemplu, , , , , , , .

Ideea de a construi criterii statistice bazate pe caracterizări prin proprietatea de echidistribuție îi aparține lui V. Linnik. La finalul lucrării sale extinse, el a scris: „. se poate pune problema construirii criteriilor pentru acordul unui eșantion cu o ipoteză complexă, pe baza distribuției identice a celor două statistici corespondente gi (xi> .xr) și g2(x, ¦¦¦xr) și reducând astfel întrebare la criteriul omogenității.”

Să ne întoarcem la teorema Polya clasică pentru a explica exemplu concret cum ar putea funcționa o astfel de abordare. În forma sa cea mai simplă, această teoremă este formulată după cum urmează.

teorema lui Polya. Fie X și Y două s centrate independente și distribuite identic. V. Apoi s. V. (X + Y)//2 și X sunt distribuite identic dacă și numai dacă legea distribuției lui X este normală.

Să presupunem că avem un eșantion de observații independente centrate Xi, ., Xn și dorim să testăm ipoteza nulă (complexă) conform căreia distribuția acestui eșantion este normală cu media 0 și o anumită varianță. Folosind eșantionul nostru, să construim funcția obișnuită de distribuție empirică (d.f.) n

Fn (t) = n-^VD

Gn(t) = n~2? VD + Xj< iv^}, t <= R1. i, j=l

În virtutea teoremei Glivenko-Cantelli, care este valabilă și pentru V-statistic empiric d.f. , pentru n mare funcția Fn(t) se apropie uniform de d.f. F (t) = P (X< t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Cu toate acestea, acest design, bazat pe ideea lui Yu V. Linnik, nu a primit aproape nicio dezvoltare, probabil din cauza dificultăților tehnice în construirea și analiza criteriilor rezultate. Un alt motiv este probabil că caracterizările distribuțiilor prin proprietatea echidistribuției sunt puține și îndepărtate.

Știm doar câteva lucrări dedicate într-un grad sau altul dezvoltării ideii lui Yu V. Linnik. Acestea sunt lucrările lui Baringhouse și Henze și Muliere și Nikitin, care vor fi discutate mai jos. Există, de asemenea, lucrări în care criteriile de bunătate de potrivire pentru distribuții specifice sunt, de asemenea, construite pe baza caracterizărilor, dar nu pe baza echidistribuției, de exemplu, , , , , , , , .

Cea mai frecventă utilizare în literatură este de a caracteriza distribuția exponențială folosind diverse variante ale proprietății fără memorie , , , , , , .

Trebuie remarcat faptul că în aproape toate aceste lucrări (cu excepția poate) AOE al criteriilor luate în considerare nu este calculat sau discutat. În această teză, nu doar studiem proprietățile asimptotice ale criteriilor de caracterizare cunoscute și propuse de noi, ci și calculăm AOE local exact (sau aproximativ) al acestora conform Bahadur.

Să definim acum conceptul de AOE. Fie (Tn) și (1^) două secvențe de statistici construite dintr-un eșantion X,., Xn cu distribuție Pd, unde în € 0 C R1, iar ipoteza nulă Ho este testată: 9 € în C față de alternativa A: în € ©-x = ©-6o. Fie Mm (a, P,0) dimensiunea minimă a eșantionului X[,., Xn, pentru care secvența (Tn) cu un nivel de semnificație dat, a > 0 atinge puterea /3< 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Deoarece eficiența relativă în funcție de trei argumente nu poate fi calculată în mod explicit nici măcar pentru cele mai simple statistici, se obișnuiește să se ia în considerare limitele:

Ptet, y (a,/?, 0), Ntet, y (a,/3,0).

In primul caz se obtine AOE dupa Bahadur, a doua limita determina AOE dupa Hodges-Lehman, iar a treia conduce la determinarea AOE dupa Pitman. Întrucât în ​​aplicațiile practice sunt cele mai interesante cazurile de niveluri de semnificație scăzute, puteri mari și alternative apropiate, toate cele trei definiții par rezonabile și naturale.

În această lucrare, pentru a compara criteriile, vom folosi AOE conform Bahadur. Există mai multe motive pentru aceasta. În primul rând, eficiența Pitman este potrivită în principal pentru statistici normale asimptotic și în această condiție coincide cu eficiența locală Bach-Dur, . Considerăm nu numai statisticile asimptotic normale, ci și statisticile de tip patratic, pentru care distribuția limită în ipoteza nulă diferă brusc de normală, astfel încât eficiența Pitman nu este aplicabilă. În al doilea rând, AOE Hodges-Lehman este nepotrivit pentru studierea criteriilor cu două laturi, deoarece toate se dovedesc a fi optime asimptotic, iar pentru criteriile unilaterale acest AOE coincide de obicei local cu AOE Bahadur. În al treilea rând, recent s-au înregistrat progrese semnificative în domeniul abaterilor mari pentru statisticile de testare, ceea ce este crucial atunci când se calculează AOE Bahadur. Ne referim la marile abateri ale statisticilor U- și V descrise în lucrări recente și.

Să trecem acum la o privire de ansamblu asupra conținutului disertației. Primul capitol este de natură auxiliară. Prezintă informațiile teoretice și tehnice necesare din teoria 11-statisticii, teoria abaterilor mari și teoria eficienta asimptotica conform lui Bahadur.

Capitolul 2 este dedicat construcției și studiului criteriilor de testare a ipotezei de simetrie. Baringhouse și Henze au propus ideea de a construi criterii de simetrie pe baza următoarei caracterizări elementare.

Fie X și Y n.o.s.v.s având un d.f continuu. Apoi |X| și |max (X, Y)| distribuite identic dacă și numai dacă X și Y sunt distribuite simetric în jurul zero.

Folosim această caracterizare pentru a construi noi criterii de simetrie. Să ne amintim că mai multe criterii de simetrie clasice (vezi, Capitolul 4) se bazează pe caracterizarea simetriei prin proprietatea și mai simplă a echidistribuției a X și -X.

Să revenim la caracterizarea Baringhouse-Hentze. Fie X, ., Xn observații având un d.f continuu.<7. Рассмотрим проверку гипотезы симметрии:

H0: OD = 1 —<3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в >0-alternativă oblică, adică d(x-b) = 2f(x)F ($x), c > 0-alternativă Leman, adică G(x-, 6) = F1+ e (x), 6 > 0 și alternativa de poluare , adică G(x-6) = (1 - 6) F(x) + 6Fr+1(x), în > 0, r > 0, unde F (x) și f (x) sunt d.f. și densitatea unei distribuții simetrice.

În conformitate cu caracterizarea de mai sus, un df empiric este construit pe baza |Xj|,., Xn, n

Hn (t) = n~2 J2 Tmax (X^Xk)<г}. На основе этих функций составляются статистики: лоо ):

Fie X uY nenegativ și nedegenerat n.o.s.v.s având un d.f diferențiabil la zero. F și fie 0< а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Pe lângă construirea criteriului de acord în sine și studierea proprietăților sale asimptotice, este interesant să se calculeze AOE a unui nou criteriu și să se studieze dependența acestuia de parametrul a.

A doua generalizare a acestei caracterizări îi aparține lui Des. O formulăm pe baza unor lucrări mai recente:

Fie Xi, ., Xm, m ^ 2 i.s nenegativ și nedegenerat. r.v.s având un d.f diferențiabil la zero. F. Atunci statisticile X și m minpfi, ., Xm) sunt distribuite identic dacă și numai dacă F este un d.f. legea exponenţială.

Fie Xx,., Xn observații independente având d.f. Pe baza caracterizărilor formulate mai sus, putem testa ipoteza exponenţială Ho, care constă în faptul că (7 este d.f. al legii exponenţiale. P, faţă de alternativa H, care constă în faptul că C f? sub adiţional slab. conditii.

În conformitate cu aceste caracterizări, se construiește un df empiric. p = pVD< О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Ne propunem să se bazeze criteriile de verificare a exponenţialităţii pe statistici: pkp = - c&bdquo-(*)] aop(1).

Ca alternative, alegem alternativele standard utilizate în literatura de specialitate privind testarea exponențială: alternativa Weibull cu d(x) = (β + 1)xx(-x1+β), x ^ 0- alternativa Makehama cu d(x) = ( 1 + 0(1 - exp (-x))) exp (-x - 0(exp (-x) - 1 + x)), x ^ 0 - o alternativă la liniaritatea funcției rata de eșec cu d (x) = (1 + bx) exp[—x—^bx2], x^O.

Pentru cele două statistici propuse mai sus, distribuțiile limită sub ipoteza nulă se scriu:

Teorema 3.2.1 Pentru statisticile Uε pentru n -* oo, relația este valabilă: unde Dz(a) este definit în (3.2.2). Teorema 3.3.1 Pentru statisticile n ca n -> oo relația este valabilă

U0,(t + 1)2A1(t)), unde D4 (t) este definit în (3.3.6).

Deoarece ambele statistici depind de parametrii a și m, stabilim la ce valori ale parametrilor AOE conform Bahadur ating maximul și găsim aceste valori. În plus, construim o alternativă în care maximul este atins în punctul și φ ½.

Al patrulea capitol este consacrat testării ipotezei de normalitate. Există multe caracterizări ale legii normale ca una dintre legile centrale ale teoriei probabilităților și ale statisticii matematice și două monografii dedicate exclusiv acestei probleme. Vom lua în considerare o versiune ușor simplificată a caracterizarii binecunoscute a și:

Fie Xr, X2, ., Xm centrate n.o.s.v.s având d.f. o constantele a, a-2,., am sunt astfel încât 0< а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Fie X, ., Xn un eșantion cu d.f. G. Pe baza acestei caracterizări, putem testa ipoteza principală R0, care este că G este un d.f. legea normală Fa (x) = Ф (x/a), față de alternativa Hi, care este că G φ Fa. Se construiește df empiric obișnuit. Gn şi V-statistice d.f. n^

Bm, n (t) = n~t (E1 + - +< *}),

1.¿-t=1 s

În continuare, simbolul a înseamnă însumarea tuturor permutărilor indicilor. Criteriile de testare a normalității se pot baza pe următoarele statistici:

B, n = Г dGn (t), J -00 oo

BmAt)-Gn (t)]dGn (t), oo

Bin = G autorul Kremlev Sergey

Opțiunea optimă Analiza scenariilor posibile de desfășurare a evenimentelor face inevitabil să ne gândim la alegerea opțiunii optime. Nu se poate spune că diversele opțiuni „de vară”, adică alternative legate de mai-iunie - iulie 1941, inspiră optimism. Nu, ei

Cea mai bună opțiune

Din cartea Marea Alternativă Patriotică autor Isaev Alexey Valerievici

Opțiunea optimă Analiza scenariilor posibile de desfășurare a evenimentelor face inevitabil să ne gândim la alegerea opțiunii optime. Nu se poate spune că diversele opțiuni „de vară”, adică alternativele legate de mai - iunie - iulie 1941, inspiră optimism. Nu, ei

Control optim

Din cartea Stima de sine la copii și adolescenți. Carte pentru părinți de Eyestad Gyru

Control optim Ce înseamnă să ții moderat de strâns? Trebuie să determinați singur acest lucru, pe baza cunoștințelor dumneavoastră despre propriul copil și a condițiilor mediului în care trăiți. În cele mai multe cazuri, părinții adolescenților încearcă să-și protejeze copiii de fumat, consumul de alcool,

Mod optim

Din cartea Paradoxul perfecționist de Ben-Shahar Tal

Calea optimă Suntem bombardați constant de perfecțiune. Adonis găzduiește coperta Men’s Health, Elena cea Frumoasă pe coperta Vogue; femeile și bărbații de pe marele ecran, într-o oră sau două, își rezolvă conflictele, joacă un complot ideal, se dăruiesc iubirii ideale. Cu toții am auzit

Abordare optimă

Din cartea Expert nr. 07 (2013) revista Expert a autorului

Abordare optimă Serghei Kostyaev, candidat la științe politice, cercetător senior la INION RAS Departamentul Apărării al SUA a cheltuit un miliard de dolari pe un program de calculator nefuncțional Foto: EPA De la 1 martie, cheltuielile Pentagonului vor fi reduse probabil cu 43 de miliarde

Cea mai bună opțiune

Din cartea Două anotimpuri autorul Arseniev L

Opțiune optimă - Spune-mi, este înțelept să joci pe mai multe fronturi deodată? - i-au întrebat jurnaliștii pe Bazilevich și Lobanovsky chiar la începutul sezonului ’75 „Este nerezonabil, desigur”, au răspuns ei. - Dar este necesar. Credem că este imperativ să diferențiem semnificația

Control optim

Din cartea Managing Personal (Family) Finances. Abordare sistematică autor Steinbock Mihail

Control optim >> Cu un control optim, împărțim toate costurile în două grupuri mari: – „de rutină” – cheltuieli obișnuite, – cheltuieli unice sau non-standard. Controlul optim poate fi utilizat numai după câteva luni de control detaliat.

ÎN conditii moderne Interesul pentru analiza datelor crește constant și intens în domenii complet diferite, precum biologie, lingvistică, economie și, desigur, IT. Baza acestei analize sunt metodele statistice și fiecare specialist în minerit de date care se respectă trebuie să le înțeleagă.

Din păcate, într-adevăr literatură bună, astfel încât să poată oferi atât dovezi riguroase din punct de vedere matematic, cât și explicații intuitive clare, nu este foarte comun. Și aceste prelegeri, în opinia mea, sunt neobișnuit de bune pentru matematicienii care înțeleg teoria probabilității tocmai din acest motiv. Aceștia sunt predați masteraților de la Universitatea Germană Christian-Albrecht în programele de Matematică și Matematică financiară. Și pentru cei care sunt interesați de modul în care se predă această materie în străinătate, am tradus aceste prelegeri. Mi-a luat câteva luni să traduc, am diluat prelegerile cu ilustrații, exerciții și note de subsol pe unele teoreme. Observ că nu traducător profesionist, ci doar un altruist si amator in acest domeniu, asa ca voi accepta orice critica daca este constructiva.

Pe scurt, despre asta sunt prelegerile:


Așteptări matematice condiționate

Acest capitol nu se referă direct la statistici, însă este ideal pentru a începe să-l studiezi. Așteptarea condiționată este cea mai bună alegere pentru a prezice un rezultat aleatoriu pe baza informațiilor deja disponibile. Și aceasta este, de asemenea, o variabilă aleatorie. Aici luăm în considerare diferitele sale proprietăți, cum ar fi liniaritatea, monotonitatea, convergența monotonă și altele.

Bazele estimării punctelor

Cum se estimează parametrul de distribuție? Ce criteriu ar trebui să aleg pentru asta? Ce metode ar trebui să folosesc? Acest capitol vă permite să răspundeți la toate aceste întrebări. Aici introducem conceptele de estimator imparțial și de estimator de varianță minimă uniform imparțial. Explică de unde provin distribuțiile chi-pătrat și t și de ce sunt importante în estimarea parametrilor unei distribuții normale. Acesta explică ce sunt inegalitatea Rao-Kramer și informațiile Fisher. Se introduce și conceptul de familie exponențială, ceea ce facilitează foarte mult obținerea unei bune estimări.

Estimarea parametrilor bayesieni și minimax

O abordare filosofică diferită a evaluării este descrisă aici. În acest caz, parametrul este considerat necunoscut deoarece este o realizare a unei anumite variabile aleatoare cu o distribuție cunoscută (a priori). Prin observarea rezultatului experimentului, calculăm așa-numita distribuție posterioară a parametrului. Pe baza acesteia, putem obține un estimator bayesian, unde criteriul este pierderea minimă în medie, sau un estimator minimax, care minimizează pierderea maximă posibilă.

Suficiență și completitudine

Acest capitol este serios valoare aplicată. O statistică suficientă este o funcție a eșantionului astfel încât este suficient să stocați doar rezultatul acestei funcții pentru a estima parametrul. Există multe astfel de funcții, iar printre ele se numără așa-numitele statistici minime suficiente. De exemplu, pentru a estima mediana unei distribuții normale, este suficient să stocați un singur număr - media aritmetică pentru întregul eșantion. Funcționează și pentru alte distribuții, cum ar fi distribuția Cauchy? Cum ajută statisticile suficiente în alegerea estimărilor? Aici puteți găsi răspunsuri la aceste întrebări.

Proprietățile asimptotice ale estimărilor

Poate cel mai important și proprietatea necesara estimările sunt consistența acestuia, adică dorința de a realiza un parametru adevărat pe măsură ce dimensiunea eșantionului crește. Acest capitol descrie ce proprietăți au estimările cunoscute de noi, obținute așa cum este descris în capitolele anterioare. metode statistice. Sunt introduse conceptele de imparțialitate asimptotică, eficiență asimptotică și distanță Kullback-Leibler.

Bazele testării

Pe lângă întrebarea cum să estimăm un parametru necunoscut pentru noi, trebuie să verificăm cumva dacă îndeplinește proprietățile cerute. De exemplu, se desfășoară un experiment pentru a testa un nou medicament. De unde știi dacă probabilitatea de recuperare este mai mare cu ea decât cu utilizarea medicamentelor vechi? Acest capitol explică modul în care sunt construite astfel de teste. Veți afla care este cel mai puternic test uniform, testul Neyman-Pearson, nivelul de semnificație, intervalul de încredere și de unde provin bine-cunoscutul test Gaussian și testul t.

Proprietățile asimptotice ale criteriilor

La fel ca notele, criteriile trebuie să satisfacă anumite proprietăți asimptotice. Uneori pot apărea situații când este imposibil să construim criteriul cerut, totuși, folosind binecunoscuta teoremă centrală a limitei, construim un criteriu care tinde asimptotic către cel necesar. Aici veți afla care este nivelul de semnificație asimptotică, metoda raportului de probabilitate și cum sunt construite testul Bartlett și testul chi-pătrat al independenței.

Model liniar

Acest capitol poate fi privit ca un complement, și anume aplicarea statisticii în cazul regresiei liniare. Veți înțelege ce note sunt bune și în ce condiții. Vei afla de unde a venit metoda cele mai mici pătrate, cum se construiesc criterii și de ce este necesară distribuția F.