Semnificație statistică. Evaluarea fiabilității rezultatelor unui studiu statistic

În orice situație științifică și practică a unui experiment (sondaj), cercetătorii pot studia nu toți oamenii (populația generală, populația), ci doar un anumit eșantion. De exemplu, chiar dacă studiem un grup relativ mic de oameni, cum ar fi cei care suferă de o anumită boală, este încă foarte puțin probabil să avem resursele adecvate sau nevoia de a testa fiecare pacient. În schimb, este obișnuit să testați un eșantion din populație, deoarece este mai convenabil și necesită mai puțin timp. Dacă da, de unde știm că rezultatele obținute din eșantion sunt reprezentative pentru întregul grup? Sau, pentru a folosi terminologia profesională, putem fi siguri că cercetarea noastră descrie corect întregul populatie, eșantionul pe care l-am folosit?

Pentru a răspunde la această întrebare, este necesar să se determine semnificația statistică a rezultatelor testului. Semnificație statistică (Nivel semnificativ, prescurtat Sig.), sau /7-nivel de semnificație (nivel p) - este probabilitatea ca acest rezultat reprezintă corect populația din care a fost eșantionat studiul. Rețineți că aceasta este numai probabilitate- este imposibil de spus cu o garanție absolută că acest studiu descrie corect întreaga populație. În cel mai bun caz, nivelul de semnificație poate doar concluziona că acest lucru este foarte probabil. Astfel, se pune inevitabil următoarea întrebare: ce nivel de semnificație trebuie să fie înainte ca un rezultat dat să poată fi considerat o caracterizare corectă a populației?

De exemplu, la ce valoare a probabilității ești dispus să spui că astfel de șanse sunt suficiente pentru a-ți asuma un risc? Ce se întâmplă dacă șansele sunt 10 din 100 sau 50 din 100? Ce se întâmplă dacă această probabilitate este mai mare? Dar cote ca 90 din 100, 95 din 100 sau 98 din 100? Pentru o situație care implică risc, această alegere este destul de problematică, deoarece depinde de caracteristicile personale ale persoanei.

În psihologie, se crede în mod tradițional că o șansă de 95 sau mai mult din 100 înseamnă că probabilitatea ca rezultatele să fie corecte este suficient de mare pentru ca acestea să fie generalizabile la întreaga populație. Această cifră a fost stabilită în procesul activității științifice și practice - nu există nicio lege conform căreia ar trebui să fie aleasă ca ghid (și într-adevăr, în alte științe, uneori se aleg și alte valori ale nivelului de semnificație).

În psihologie, această probabilitate este operată într-un mod oarecum neobișnuit. În loc de probabilitatea ca eșantionul să reprezinte populația, probabilitatea ca eșantionul nu reprezinta populatie. Cu alte cuvinte, este probabilitatea ca relația sau diferențele observate să fie aleatoare și nu o proprietate a populației. Deci, în loc să spună că există o șansă de 95 din 100 ca rezultatele unui studiu să fie corecte, psihologii spun că există o șansă de 5 din 100 ca rezultatele să fie greșite (la fel cum o șansă de 40 din 100 ca rezultatele să fie corecte înseamnă o șansă de 60 din 100 în favoarea incorectitudinii lor). Valoarea probabilității este uneori exprimată ca procent, dar mai des este scrisă ca zecimal. De exemplu, 10 șanse din 100 sunt exprimate ca o fracție zecimală de 0,1; 5 din 100 este scris ca 0,05; 1 din 100 - 0,01. Cu această formă de înregistrare, valoarea limită este 0,05. Pentru ca un rezultat să fie considerat corect, nivelul său de semnificație trebuie să fie de mai jos acest număr (rețineți că aceasta este probabilitatea ca rezultatul gresit descrie populația). Pentru a scoate terminologia din drum, să adăugăm că „probabilitatea ca rezultatul să fie incorect” (care se numește mai corect nivel de semnificație) notată de obicei printr-o literă latină R. Descrierile rezultatelor experimentale includ, de obicei, o declarație rezumată, cum ar fi „rezultatele au fost semnificative la nivelul de încredere (R(p) mai puțin de 0,05 (adică mai puțin de 5%).

Astfel, nivelul de semnificație ( R) indică probabilitatea ca rezultatele Nu reprezinta populatia. În mod tradițional în psihologie, rezultatele sunt considerate a reflecta în mod fiabil imaginea de ansamblu dacă valoarea R mai puțin de 0,05 (adică 5%). Cu toate acestea, aceasta este doar o afirmație probabilistică și deloc o garanție necondiționată. În unele cazuri, această concluzie poate să nu fie corectă. De fapt, putem calcula cât de des s-ar putea întâmpla acest lucru dacă ne uităm la magnitudinea nivelului de semnificație. La un nivel de semnificație de 0,05, de 5 din 100 de ori rezultatele sunt probabil să fie incorecte. 11a la prima vedere pare că acest lucru nu este foarte obișnuit, dar dacă vă gândiți bine, atunci 5 șanse din 100 sunt la fel cu 1 din 20. Cu alte cuvinte, într-unul din 20 de cazuri rezultatul va fi incorect. Astfel de șanse nu par deosebit de favorabile, iar cercetătorii ar trebui să se ferească de a se comite erori de primul tip. Acesta este numele pentru eroarea care apare atunci când cercetătorii cred că au descoperit rezultate reale, dar de fapt nu există. Eroarea opusă, care constă în faptul că cercetătorii cred că nu au găsit un rezultat când de fapt există unul, se numește erori de al doilea tip.

Aceste erori apar deoarece este imposibil de exclus posibilitatea ca analize statistice. Probabilitatea de eroare depinde de nivelul de semnificație statistică a rezultatelor. Am observat deja că pentru ca un rezultat să fie considerat corect, nivelul de semnificație trebuie să fie sub 0,05. Desigur, unele rezultate sunt mai mici decât atât și nu este neobișnuit să vezi rezultate de până la 0,001 (o valoare de 0,001 înseamnă că există o șansă de 1 la 1000 ca rezultatele să fie greșite). Cum valoare mai mică p, cu atât este mai puternică încrederea noastră în corectitudinea rezultatelor.

În tabel 7.2 arată interpretarea tradițională a nivelurilor de semnificație cu privire la posibilitatea de inferență statistică și rațiunea deciziei despre prezența unei relații (diferențe).

Tabelul 7.2

Interpretarea tradițională a nivelurilor de semnificație utilizate în psihologie

Pe baza experienței cercetării practice, se recomandă: pentru a evita pe cât posibil erorile de primul și al doilea tip, atunci când se trag concluzii importante, trebuie luate decizii cu privire la prezența diferențelor (legăturilor), concentrându-se pe nivel. R semnul n.

Test statistic(Test statistic - este un instrument de determinare a nivelului de semnificație statistică. Aceasta este o regulă decisivă care asigură că o ipoteză adevărată este acceptată și o ipoteză falsă este respinsă cu mare probabilitate.

Criteriile statistice denotă și metoda de calcul a unui anumit număr și numărul în sine. Toate criteriile sunt folosite cu unul singur scopul principal: defini nivelul de semnificație datele pe care le analizează (adică, probabilitatea ca datele să reflecte un efect adevărat care reprezintă corect populația din care este extras eșantionul).

Unele teste pot fi utilizate numai pentru date distribuite normal (și dacă trăsătura este măsurată pe o scară de interval) - aceste teste sunt de obicei numite parametrice. Folosind alte criterii, puteți analiza datele cu aproape orice lege de distribuție - sunt numite neparametric.

Criteriile parametrice sunt criterii care includ parametrii de distribuție în formula de calcul, i.e. medii și varianțe (testul t al lui Student, testul F al lui Fisher etc.).

Criteriile neparametrice sunt criterii care nu includ parametrii de distribuție în formula de calcul a parametrilor de distribuție și se bazează pe operarea cu frecvențe sau ranguri (criteriul Q criteriul Rosenbaum U Mana - Whitney

De exemplu, când spunem că semnificația diferențelor a fost determinată de testul t al lui Student, ne referim că metoda testului t al lui Student a fost folosită pentru a calcula valoarea empirică, care este apoi comparată cu valoarea tabelată (critică).

Prin raportul dintre valorile empirice (calculate de noi) și cele critice ale criteriului (tabelar) putem judeca dacă ipoteza noastră este confirmată sau infirmată. În cele mai multe cazuri, pentru a recunoaște diferențele ca fiind semnificative, este necesar ca valoarea empirică a criteriului să depășească valoarea critică, deși există criterii (de exemplu, testul Mann-Whitney sau testul semnului) în care trebuie să aderăm la regula opusă.

În unele cazuri, formula de calcul pentru criteriu include numărul de observații din eșantionul studiat, notat ca P. Folosind un tabel special, determinăm ce nivel de semnificație statistică a diferențelor îi corespunde o anumită valoare empirică. În majoritatea cazurilor, aceeași valoare empirică a criteriului poate fi semnificativă sau nesemnificativă în funcție de numărul de observații din eșantionul studiat ( P ) sau din așa-numitul numărul de grade de libertate , care este notat ca v (g>) sau cum df (Uneori d).

știind P sau numărul de grade de libertate, folosind tabele speciale (cele principale sunt date în Anexa 5) putem determina valorile critice ale criteriului și putem compara valoarea empirică obținută cu acestea. Aceasta se scrie de obicei astfel: „când n = 22 de valori critice ale criteriului sunt t St = 2.07" sau "la v (d) = 2 valori critice ale testului Student sunt = 4,30”, etc.

De obicei, se acordă în continuare preferință criteriilor parametrice, iar noi aderăm la această poziție. Sunt considerate a fi mai fiabile și pot oferi mai multe informații și analize mai profunde. În ceea ce privește complexitatea calculelor matematice, la utilizarea programelor de calculator această complexitate dispare (dar unele altele par, totuși, destul de depășite).

În acest manual nu luăm în considerare în detaliu problema statisticii
ipotezele (nule - R0 și alternative - Hj) și deciziile statistice luate, întrucât studenții la psihologie studiază acest lucru separat la disciplina „Metode matematice în psihologie”. În plus, trebuie menționat că la înregistrare raport de cercetare(lucru sau teza, publicații) ipotezele statistice și soluțiile statistice, de regulă, nu sunt date. De obicei, atunci când descriu rezultatele, ele indică criteriul, furnizează statisticile descriptive necesare (medii, sigma, coeficienți de corelație etc.), valori empirice ale criteriilor, grade de libertate și, în mod necesar, nivelul p de semnificație. Apoi se formulează o concluzie semnificativă cu privire la ipoteza testată, indicând (de obicei sub forma unei inegalități) nivelul de semnificație atins sau neatins.

CARACTERISTICA PLATITA. Funcția de semnificație statistică este disponibilă numai pentru anumite planuri. Verificați dacă este în .

Puteți afla dacă există diferențe semnificative statistic în răspunsurile primite de la grupuri diferite respondenții la întrebările sondajului. Pentru a utiliza funcția de semnificație statistică în SurveyMonkey, trebuie să:

Activați funcția de semnificație statistică atunci când adăugați o regulă de comparație la o întrebare din sondajul dvs. Selectați grupuri de respondenți de comparat pentru a sorta rezultatele sondajului în grupuri pentru comparare vizuală.
Examinați tabelele de date pentru întrebările din sondaj pentru a identifica orice diferențe semnificative statistic în răspunsurile primite de la diferite grupuri de respondenți.

Vedeți semnificația statistică

Urmând pașii de mai jos, puteți crea un sondaj care afișează semnificația statistică.

1. Adăugați întrebări închise la sondaj

Pentru a afișa semnificația statistică atunci când analizați rezultatele, va trebui să aplicați o regulă de comparare oricărei întrebări din sondaj.

Puteți aplica regula de comparare și puteți calcula semnificația statistică a răspunsurilor dacă utilizați unul dintre următoarele tipuri de întrebări în proiectarea sondajului:

Este necesar să vă asigurați că opțiunile de răspuns propuse pot fi împărțite în grupuri complete. Opțiunile de răspuns pe care le selectați pentru comparație atunci când creați o regulă de comparație vor fi folosite pentru a organiza datele în tabele încrucișate pe parcursul sondajului.

2. Adunați răspunsuri

După ce ați completat sondajul, creați un colector pentru a-l distribui. Există mai multe moduri.

Trebuie să primiți cel puțin 30 de răspunsuri pentru fiecare opțiune de răspuns pe care intenționați să o utilizați în regula de comparație pentru a activa și vizualiza semnificația statistică.

Exemplu de sondaj

Vrei să afli dacă bărbații sunt mult mai mulțumiți de produsele tale decât femeile.

Adăugați două întrebări cu alegere multiplă la sondaj:
care este sexul tău? (Masculin Feminin)
Sunteți mulțumit sau nemulțumit de produsul nostru? (mulțumit, nemulțumit)
Asigurați-vă că cel puțin 30 de respondenți selectează „bărbați” pentru întrebarea de gen ȘI cel puțin 30 de respondenți selectează „femeie” ca gen.
Adăugați o regulă de comparație la întrebarea „Care este sexul dvs.?” și selectați ambele opțiuni de răspuns ca grupurile dvs.
Utilizați tabelul de date de sub tabelul cu întrebări „Sunteți mulțumit sau nemulțumit de produsul nostru?” pentru a vedea dacă vreo opțiune de răspuns arată o diferență semnificativă statistic

Care este o diferență semnificativă statistic?

O diferență semnificativă statistic înseamnă că analiza statistică a determinat că există diferențe semnificative între răspunsurile unui grup de respondenți și răspunsurile altui grup. Semnificația statistică înseamnă că numerele obținute sunt semnificativ diferite. Astfel de cunoștințe vă vor ajuta foarte mult în analiza datelor. Cu toate acestea, determinați importanța rezultatelor obținute. Tu ești cel care decide cum să interpretezi rezultatele sondajului și ce acțiuni ar trebui întreprinse pe baza acestora.

De exemplu, primiți mai multe plângeri de la clienți femei decât de la clienți bărbați. Cum putem determina dacă o astfel de diferență este reală și dacă trebuie luate măsuri în privința ei? O modalitate excelentă de a vă testa observațiile este să efectuați un sondaj care să vă arate dacă clienții bărbați sunt mult mai mulțumiți de produsul dvs. Folosind o formulă statistică, funcția noastră de semnificație statistică vă va oferi posibilitatea de a determina dacă produsul dvs. este de fapt mult mai atrăgător pentru bărbați decât pentru femei. Acest lucru vă va permite să luați măsuri bazate pe fapte, mai degrabă decât pe presupuneri.

Diferență semnificativă statistic

Dacă rezultatele dvs. sunt evidențiate în tabelul de date, înseamnă că cele două grupuri de respondenți sunt semnificativ diferite unul de celălalt. Termenul „semnificativ” nu înseamnă că numerele rezultate au o importanță sau o semnificație deosebită, ci doar că există o diferență statistică între ele.

Nicio diferență semnificativă statistic

Dacă rezultatele dvs. nu sunt evidențiate în tabelul de date corespunzător, aceasta înseamnă că, deși poate exista o diferență între cele două cifre comparate, nu există nicio diferență statistică între ele.

Răspunsurile fără diferențe semnificative statistic demonstrează că nu există nicio diferență semnificativă între cei doi itemi comparați, având în vedere dimensiunea eșantionului pe care îl utilizați, dar acest lucru nu înseamnă neapărat că nu sunt semnificativi. Poate prin creșterea dimensiunii eșantionului, veți putea identifica o diferență semnificativă statistic.

Marime de mostra

Dacă aveți o dimensiune foarte mică a eșantionului, doar diferențele foarte mari între cele două grupuri vor fi semnificative. Dacă aveți o dimensiune foarte mare a eșantionului, atât diferențele mici, cât și cele mari vor fi considerate semnificative.

Cu toate acestea, dacă două numere sunt diferite din punct de vedere statistic, asta nu înseamnă că diferența dintre rezultate are vreo semnificație practică pentru tine. Va trebui să decideți singur ce diferențe sunt semnificative pentru sondajul dvs.

Calcularea semnificației statistice

Calculăm semnificația statistică folosind un nivel de încredere standard de 95%. Dacă o opțiune de răspuns este prezentată ca fiind semnificativă din punct de vedere statistic, înseamnă că din întâmplare sau din cauza unei erori de eșantionare există o probabilitate mai mică de 5% ca diferența dintre cele două grupuri să apară (deseori prezentată ca: p<0,05).

Pentru a calcula diferențele semnificative statistic între grupuri, folosim următoarele formule:

Parametru	Descriere
a1	Procentul de participanți din primul grup care au răspuns la întrebare într-un anumit mod, înmulțit cu dimensiunea eșantionului acestui grup.
b1	Procentul de participanți din al doilea grup care au răspuns la întrebare într-un anumit mod, înmulțit cu dimensiunea eșantionului acestui grup.
Proporția eșantionului cumulat (p)	Combinația a două acțiuni din ambele grupuri.
Eroare standard (SE)	Un indicator al cât de mult diferă cota dvs. de cota reală. O valoare mai mică înseamnă că fracția este aproape de fracția reală, o valoare mai mare înseamnă că fracția este semnificativ diferită de fracția reală.
Test statistic (t)	Test statistic. Numărul de abateri standard prin care o anumită valoare diferă de medie.
Semnificație statistică	Dacă valoarea absolută a statisticii testului este mai mare de 1,96* abateri standard de la medie, se consideră o diferență semnificativă statistic.

*1,96 este valoarea utilizată pentru nivelul de încredere de 95%, deoarece 95% din intervalul gestionat de funcția de distribuție t a Studentului se află în 1,96 abateri standard ale mediei.

Exemplu de calcul

Continuând cu exemplul folosit mai sus, să aflăm dacă procentul bărbaților care spun că sunt mulțumiți de produsul tău este semnificativ mai mare decât procentul femeilor.

Să presupunem că 1.000 de bărbați și 1.000 de femei au participat la sondajul dvs., iar rezultatul sondajului a fost că 70% dintre bărbați și 65% dintre femei spun că sunt mulțumiți de produsul dvs. Este nivelul de 70% semnificativ mai mare decât nivelul de 65%?

Înlocuiți următoarele date din sondaj în formulele date:

p1 (% dintre bărbați mulțumiți de produs) = 0,7
p2 (% dintre femei mulțumite de produs) = 0,65
n1 (numărul de bărbați chestionați) = 1000
n2 (numărul de femei intervievate) = 1000

Deoarece valoarea absolută a statisticii testului este mai mare de 1,96, înseamnă că diferența dintre bărbați și femei este semnificativă. În comparație cu femeile, bărbații au mai multe șanse să fie mulțumiți de produsul tău.

Ascunderea semnificației statistice

Cum să ascundeți semnificația statistică pentru toate întrebările

Faceți clic pe săgeata în jos din dreapta regulii de comparație din bara laterală din stânga.
Selectați un articol Editați regula.
Dezactivați caracteristica Arată semnificația statistică folosind un comutator.
Faceți clic pe butonul aplica.

Pentru a ascunde semnificația statistică pentru o întrebare, trebuie să:

Faceți clic pe butonul Ton deasupra diagramei acestei probleme.
Deschide fila Optiuni de afisare.
Debifați caseta de lângă Semnificație statistică.
Faceți clic pe butonul Salvați.

Opțiunea de afișare este activată automat când este activată afișarea semnificației statistice. Dacă ștergeți această opțiune de afișare, afișarea semnificației statistice va fi, de asemenea, dezactivată.

Activați funcția de semnificație statistică atunci când adăugați o regulă de comparație la o întrebare din sondaj. Examinați tabelele de date pentru întrebările din sondaj pentru a determina dacă există diferențe semnificative statistic în răspunsurile primite de la diferite grupuri de respondenți.

Statisticile au devenit de multă vreme parte integrantă a vieții. Oamenii îl întâlnesc peste tot. Pe baza statisticilor, se trag concluzii despre unde și ce boli sunt comune, ce este mai solicitat într-o anumită regiune sau în rândul unui anumit segment al populației. Chiar și programele politice ale candidaților la guvernare se bazează pe asta. Ele sunt folosite și de lanțurile de retail atunci când cumpără mărfuri, iar producătorii sunt ghidați de aceste date în ofertele lor.

Statistica joacă un rol important în viața societății și afectează fiecare membru în parte chiar și în lucruri mărunte. De exemplu, dacă majoritatea oamenilor preferă culorile închise la îmbrăcăminte într-un anumit oraș sau regiune, atunci găsirea unei haine de ploaie galben strălucitor cu imprimeu floral în magazinele locale va fi extrem de dificilă. Dar ce cantități compun aceste date care au un asemenea impact? De exemplu, ce reprezintă „semnificația statistică”? Ce se înțelege mai exact prin această definiție?

Ce este asta?

Statistica ca știință constă dintr-o combinație de cantități și concepte diferite. Unul dintre ele este conceptul de „semnificație statistică”. Acesta este denumirea valorii variabilelor în care probabilitatea apariției altor indicatori este neglijabilă.

De exemplu, 9 din 10 oameni își pun pantofi de cauciuc în picioare în timpul unei plimbări de dimineață pentru a culege ciuperci în pădurea de toamnă, după o noapte ploioasă. Probabilitatea ca la un moment dat 8 dintre ei să poarte mocasini de pânză este neglijabilă. Astfel, în acest exemplu special, numărul 9 este valoarea numită „semnificație statistică”.

În consecință, dacă dezvoltăm următorul exemplu practic, magazinele de pantofi achiziționează cizme de cauciuc în cantități mai mari spre sfârșitul sezonului de vară decât în alte perioade ale anului. Astfel, amploarea unei valori statistice are un impact asupra vieții de zi cu zi.

Desigur, în calculele complexe, să zicem, atunci când se prezică răspândirea virușilor, sunt luate în considerare un număr mare de variabile. Dar însăși esența determinării unui indicator semnificativ al datelor statistice este similară, indiferent de complexitatea calculelor și de numărul de valori neconstante.

Cum se calculeaza?

Ele sunt utilizate la calcularea valorii indicatorului „semnificație statistică” al ecuației. Adică, se poate argumenta că în acest caz totul este decis de matematică. Cea mai simplă opțiune de calcul este un lanț de operații matematice, care implică următorii parametri:

două tipuri de rezultate obținute din sondaje sau studiul datelor obiective, de exemplu, sumele pentru care se fac achiziții, notate a și b;
indicator pentru ambele grupuri - n;
valoarea ponderii eșantionului combinat - p;
conceptul de „eroare standard” - SE.

Următorul pas este determinarea indicatorului general de testare - t, valoarea acestuia este comparată cu numărul 1,96. 1,96 este valoarea medie reprezentând intervalul de 95% conform funcției de distribuție t a lui Student.

Adesea apare întrebarea care este diferența dintre valorile lui n și p. Această nuanță poate fi clarificată cu ușurință cu ajutorul unui exemplu. Să presupunem că calculăm semnificația statistică a loialității față de un produs sau marcă pentru bărbați și femei.

În acest caz, desemnările literelor vor fi urmate de următoarele:

n - numărul de respondenți;
p - numărul de persoane mulțumite de produs.

Numărul de femei intervievate în acest caz va fi desemnat n1. În consecință, există n2 bărbați. Numerele „1” și „2” pentru simbolul p vor avea aceeași semnificație.

Compararea indicatorului de test cu valorile medii ale tabelelor de calcul ale Studentului devine ceea ce se numește „semnificație statistică”.

Ce se înțelege prin verificare?

Rezultatele oricărui calcul matematic pot fi întotdeauna verificate; copiii sunt învățați acest lucru în școala primară. Este logic să presupunem că, deoarece indicatorii statistici sunt determinați folosind un lanț de calcule, aceștia sunt verificați.

Cu toate acestea, testarea semnificației statistice nu se referă doar la matematică. Statistica se ocupă de un număr mare de variabile și de diverse probabilități, care nu sunt întotdeauna calculabile. Adică, dacă revenim la exemplul cu pantofi de cauciuc dat la începutul articolului, atunci construcția logică a datelor statistice pe care se vor baza cumpărătorii de mărfuri pentru magazine poate fi perturbată de vremea uscată și caldă, ceea ce nu este tipic pentru toamnă. Ca urmare a acestui fenomen, numărul de persoane care achiziționează cizme de cauciuc va scădea, iar punctele de vânzare cu amănuntul vor suferi pierderi. O formulă matematică, desigur, nu este capabilă să prezică o anomalie meteorologică. Acest moment se numește „greșeală”.

Tocmai probabilitatea unor astfel de erori este luată în considerare atunci când se verifică nivelul de semnificație calculată. Ea ia în considerare atât indicatorii calculați, cât și nivelurile de semnificație acceptate, precum și valorile numite în mod convențional ipoteze.

Care este nivelul de semnificație?

Conceptul de „nivel” este inclus în principalele criterii de semnificație statistică. Este folosit în statistica aplicată și practică. Acesta este un fel de valoare care ia în considerare probabilitatea unor posibile abateri sau erori.

Nivelul se bazează pe identificarea diferențelor în probele gata făcute și ne permite să stabilim semnificația acestora sau, dimpotrivă, aleatorietatea. Acest concept nu are doar semnificații digitale, ci și decodificări unice ale acestora. Ei explică modul în care trebuie înțeleasă valoarea, iar nivelul în sine este determinat prin compararea rezultatului cu indicele mediu, acest lucru dezvăluie gradul de fiabilitate al diferențelor.

Astfel, ne putem imagina conceptul de nivel simplu – este un indicator al unei erori sau erori acceptabile, probabile în concluziile desprinse din datele statistice obținute.

Ce niveluri de semnificație sunt utilizate?

Semnificația statistică a coeficienților de probabilitate ai unei erori în practică se bazează pe trei niveluri de bază.

Primul nivel este considerat a fi pragul la care valoarea este de 5%. Adică, probabilitatea de eroare nu depășește nivelul de semnificație de 5%. Aceasta înseamnă că încrederea în concluziile impecabile și fără erori făcute pe baza datelor cercetării statistice este de 95%.

Al doilea nivel este pragul de 1%. În consecință, această cifră înseamnă că cineva poate fi ghidat de datele obținute în timpul calculelor statistice cu o încredere de 99%.

Al treilea nivel este de 0,1%. Cu această valoare, probabilitatea unei erori este egală cu o fracțiune de procent, adică erorile sunt practic eliminate.

Ce este o ipoteză în statistică?

Erorile ca concept sunt împărțite în două direcții, referitoare la acceptarea sau respingerea ipotezei nule. O ipoteză este un concept în spatele căruia, conform definiției, se află un set de alte date sau enunțuri. Adică o descriere a distribuției probabilistice a ceva legat de subiectul contabilității statistice.

Există două ipoteze în calcule simple - zero și alternativă. Diferența dintre ele este că ipoteza nulă se bazează pe ideea că nu există diferențe fundamentale între eșantioanele implicate în determinarea semnificației statistice, iar ipoteza alternativă este complet opusă. Adică, ipoteza alternativă se bazează pe prezența unei diferențe semnificative în datele eșantionului.

Care sunt erorile?

Erorile ca concept în statistică depind direct de acceptarea uneia sau alteia ipoteze ca adevărată. Ele pot fi împărțite în două direcții sau tipuri:

primul tip se datorează acceptării ipotezei nule, care se dovedește a fi falsă;
al doilea este cauzat de urmarirea alternativei.

Primul tip de eroare se numește fals pozitiv și apare destul de des în toate domeniile în care sunt utilizate date statistice. În consecință, eroarea celui de-al doilea tip se numește fals negativ.

La ce se folosește regresia în statistică?

Semnificația statistică a regresiei este că poate fi folosită pentru a determina cât de bine corespunde realității modelul diferitelor dependențe calculate pe baza datelor; vă permite să identificați suficiența sau lipsa factorilor de luat în considerare și să trageți concluzii.

Valoarea regresiei este determinată prin compararea rezultatelor cu datele enumerate în tabelele Fisher. Sau folosind analiza varianței. Indicatorii de regresie sunt importanți pentru studii și calcule statistice complexe care implică un număr mare de variabile, date aleatorii și modificări probabile.

Semnificația statistică sau nivelul p de semnificație este principalul rezultat al testului

ipoteza statistica. În termeni tehnici, aceasta este probabilitatea de a primi un dat

rezultatul unui studiu prin eșantion, cu condiția ca de fapt pentru general

În total, ipoteza statistică nulă este adevărată - adică nu există nicio legătură. Cu alte cuvinte, asta

probabilitatea ca relația detectată să fie aleatorie și nu o proprietate

totalitate. Este semnificația statistică, nivelul p de semnificație, adică

evaluarea cantitativă a fiabilității comunicării: cu cât această probabilitate este mai mică, cu atât conexiunea este mai fiabilă.

Să presupunem că, la compararea a două medii de eșantion, s-a obținut o valoare de nivel

semnificație statistică p=0,05. Aceasta înseamnă că testarea ipotezei statistice despre

egalitatea de mijloace în populație a arătat că dacă este adevărat, atunci probabilitatea

Apariția aleatorie a diferențelor detectate nu este mai mare de 5%. Cu alte cuvinte, dacă

două probe au fost extrase în mod repetat din aceeași populație, apoi în 1 din

20 de cazuri ar dezvălui aceeași diferență sau mai mare între mediile acestor eșantioane.

Adică există o șansă de 5% ca diferențele găsite să se datoreze întâmplării.

caracter și nu sunt o proprietate a agregatului.

În raport cu o ipoteză științifică, nivelul de semnificație statistică este unul cantitativ

un indicator al gradului de neîncredere în concluzia despre existența unei legături, calculat din rezultate

testarea selectivă, empirică a acestei ipoteze. Cu cât valoarea p-level este mai mică, cu atât este mai mare

semnificația statistică a unui rezultat al cercetării care confirmă o ipoteză științifică.

Este util să știm ce influențează nivelul de semnificație. Nivel de semnificație, toate celelalte lucruri fiind egale

condițiile sunt mai mari (valoarea nivelului p este mai mică) dacă:

Mărimea conexiunii (diferența) este mai mare;

Variabilitatea trăsăturii (trăsăturii) este mai mică;

Dimensiunea(ele) eșantionului este mai mare.

Unilateral Teste de semnificație bilaterală

Dacă scopul studiului este de a identifica diferențele în parametrii a doi generali

agregate care corespund diverselor sale condiții naturale (condiții de viață,

vârsta subiecților etc.), atunci nu se știe adesea care dintre acești parametri va fi mai mare și

Care este mai mic?

De exemplu, dacă sunteți interesat de variabilitatea rezultatelor într-un test și

grupuri experimentale, atunci, de regulă, nu există încredere în semnul diferenței de varianțe sau

abaterile standard ale rezultatelor prin care se evaluează variabilitatea. În acest caz

ipoteza nulă este că varianțele sunt egale, iar scopul studiului este

demonstra contrariul, adică. prezența diferențelor între varianțe. Este permis ca

diferența poate fi de orice semn. Astfel de ipoteze se numesc cu două fețe.

Dar uneori provocarea este de a dovedi o creștere sau o scădere a unui parametru;

de exemplu, rezultatul mediu în grupul experimental este mai mare decât în grupul martor. în care

Nu mai este permis ca diferența să fie de alt semn. Astfel de ipoteze se numesc

Unilateral.

Se numesc teste de semnificație utilizate pentru a testa ipotezele cu două fețe

Face-verso, iar pentru unilateral - unilateral.

Se pune întrebarea ce criteriu trebuie ales într-un caz dat. Răspuns

Această întrebare depășește domeniul de aplicare al metodelor statistice formale și este complet

Depinde de scopurile studiului. În niciun caz nu trebuie să alegeți unul sau altul criteriu după

Efectuarea unui experiment bazat pe analiza datelor experimentale, după caz

Duce la concluzii incorecte. Dacă, înainte de a efectua un experiment, se presupune că diferența

Parametrii comparați pot fi fie pozitivi, fie negativi, atunci ar trebui

Ce crezi că face „cealaltă jumătate” a ta specială și semnificativă? Are legătură cu personalitatea ei sau cu sentimentele tale pe care le ai pentru această persoană? Sau poate cu simplul fapt că ipoteza despre caracterul aleatoriu al simpatiei tale, după cum arată studiile, are o probabilitate mai mică de 5%? Dacă considerăm că ultima afirmație este de încredere, atunci site-urile de întâlniri de succes nu ar exista în principiu:

Atunci când efectuați testări separate sau orice altă analiză a site-ului dvs., neînțelegerea „semnificației statistice” poate duce la interpretarea greșită a rezultatelor și, prin urmare, la acțiuni incorecte în procesul de optimizare a conversiilor. Acest lucru este valabil pentru miile de alte teste statistice efectuate în fiecare zi în fiecare industrie existentă.

Pentru a înțelege ce este „semnificația statistică”, trebuie să vă scufundați în istoria termenului, să aflați adevăratul său sens și să înțelegeți cum această „nouă” înțelegere veche vă va ajuta să interpretați corect rezultatele cercetării dumneavoastră.

Puțină istorie

Deși omenirea folosește statistica pentru a rezolva diverse probleme timp de multe secole, înțelegerea modernă a semnificației statistice, testarea ipotezelor, randomizarea și chiar Design of Experiments (DOE) a început să prindă contur abia la începutul secolului al XX-lea și este indisolubil legată de numele lui Sir Ronald Fisher (Sir Ronald Fisher, 1890-1962):

Ronald Fisher a fost un biolog și statistician evoluționist care avea o pasiune deosebită pentru studiul evoluției și selecției naturale în regnurile animal și vegetal. De-a lungul ilustrei sale cariere, a dezvoltat și popularizat multe instrumente statistice utile pe care le folosim și astăzi.

Fisher a folosit tehnicile pe care le-a dezvoltat pentru a explica procese din biologie, cum ar fi dominanța, mutațiile și deviațiile genetice. Putem folosi aceleași instrumente astăzi pentru a optimiza și îmbunătăți conținutul resurselor web. Faptul că aceste instrumente de analiză pot fi folosite pentru a lucra cu obiecte care nici măcar nu existau la momentul creării lor pare destul de surprinzător. Este la fel de surprinzător că oamenii obișnuiau să efectueze calcule complexe fără calculatoare sau computere.

Pentru a descrie rezultatele unui experiment statistic ca având o mare probabilitate de a fi adevărate, Fisher a folosit cuvântul „semnificație”.

De asemenea, una dintre cele mai interesante dezvoltări ale lui Fisher poate fi numită ipoteza „fiului sexy”. Conform acestei teorii, femeile preferă bărbații promiscui sexual (promiscui), deoarece acest lucru va permite fiilor născuți din acești bărbați să aibă aceeași predispoziție și să producă mai mulți descendenți (rețineți că aceasta este doar o teorie).

Dar nimeni, chiar și oamenii de știință geniali, nu este imun de a face greșeli. Defectele lui Fisher încă îi afectează pe specialiști până în prezent. Dar amintiți-vă cuvintele lui Albert Einstein: „Cine nu a greșit niciodată nu a creat nimic nou”.

Înainte de a trece la următorul punct, rețineți: semnificația statistică este atunci când diferența dintre rezultatele testelor este atât de mare încât diferența nu poate fi explicată prin factori aleatori.

Care este ipoteza ta?

Pentru a înțelege ce înseamnă „semnificație statistică”, trebuie mai întâi să înțelegeți ce este „testarea ipotezei”, deoarece cei doi termeni sunt strâns legați.
O ipoteză este doar o teorie. Odată ce ați dezvoltat o teorie, va trebui să stabiliți un proces pentru a colecta suficiente dovezi și pentru a colecta efectiv acele dovezi. Există două tipuri de ipoteze.

Mere sau portocale - care este mai bine?

Ipoteza nulă

De regulă, aici mulți oameni se confruntă cu dificultăți. Un lucru de reținut este că o ipoteză nulă nu este ceva ce trebuie dovedit, așa cum demonstrezi că o anumită modificare pe un site web va duce la o creștere a conversiilor, ci invers. Ipoteza nulă este o teorie care afirmă că dacă faci vreo modificare a site-ului, nu se va întâmpla nimic. Iar scopul cercetătorului este să infirme această teorie, nu să o demonstreze.

Dacă ne uităm la experiența soluționării infracțiunilor, unde anchetatorii formează și ipoteze cu privire la cine este infractorul, ipoteza nulă ia forma așa-numitei prezumții de nevinovăție, concept conform căruia acuzatul este prezumat nevinovat până la proba vinovăției. într-o instanță de judecată.

Dacă ipoteza nulă este că două obiecte sunt egale în proprietățile lor și încercați să demonstrați că unul este mai bun (de exemplu, A este mai bun decât B), trebuie să respingeți ipoteza nulă în favoarea alternativei. De exemplu, comparați unul sau altul instrument de optimizare a conversiilor. În ipoteza nulă, ambele au același efect (sau nici un efect) asupra țintei. În mod alternativ, efectul unuia dintre ele este mai bun.

Ipoteza dvs. alternativă poate conține o valoare numerică, cum ar fi B - A > 20%. În acest caz, ipoteza nulă și alternativa pot lua următoarea formă:

Un alt nume pentru o ipoteză alternativă este o ipoteză de cercetare, deoarece cercetătorul este întotdeauna interesat să demonstreze această ipoteză particulară.

Semnificația statistică și valoarea p

Să revenim din nou la Ronald Fisher și la conceptul său de semnificație statistică.

Acum că aveți o ipoteză nulă și o alternativă, cum puteți demonstra una și infirma pe cealaltă?

Deoarece statisticile, prin însăși natura lor, implică studiul unei anumite populații (eșantion), nu poți fi niciodată 100% sigur de rezultatele obținute. Un bun exemplu: rezultatele alegerilor diferă adesea de rezultatele sondajelor preliminare și chiar ale grupurilor de ieșire.

Dr. Fisher a vrut să creeze o linie de demarcație care să vă permită să știți dacă experimentul dvs. a fost un succes sau nu. Așa a apărut indicele de fiabilitate. Credibilitatea este nivelul pe care îl luăm pentru a spune ceea ce considerăm „semnificativ” și ceea ce nu. Dacă „p”, indicele de semnificație, este de 0,05 sau mai puțin, atunci rezultatele sunt de încredere.

Nu vă faceți griji, de fapt nu este atât de confuz pe cât pare.

Distribuția de probabilitate gaussiană. De-a lungul marginilor sunt valorile mai puțin probabile ale variabilei, în centru sunt cele mai probabile. Scorul P (zona umbrită în verde) este probabilitatea ca rezultatul observat să apară întâmplător.

Distribuția normală de probabilitate (distribuția Gauss) este o reprezentare a tuturor valorilor posibile ale unei anumite variabile pe un grafic (în figura de mai sus) și frecvențele acestora. Dacă faci cercetările corect și apoi trasezi toate răspunsurile pe un grafic, vei obține exact această distribuție. Conform distribuției normale, veți primi un procent mare de răspunsuri similare, iar opțiunile rămase vor fi situate la marginile graficului (așa-numitele „cozi”). Această distribuție a valorilor se găsește adesea în natură, motiv pentru care este numită „normală”.

Folosind o ecuație bazată pe eșantionul și rezultatele testelor, puteți calcula ceea ce se numește „statistică de testare”, care va indica cât de mult se abate rezultatele dvs. De asemenea, vă va spune cât de aproape sunteți ca ipoteza nulă să fie adevărată.

Pentru a vă ajuta să vă înțelegeți, utilizați calculatoare online pentru a calcula semnificația statistică:

Un exemplu de astfel de calculatoare

Litera „p” reprezintă probabilitatea ca ipoteza nulă să fie adevărată. Dacă numărul este mic, va indica o diferență între grupurile de testare, în timp ce ipoteza nulă ar fi că acestea sunt aceleași. Grafic, va părea că statistica dvs. de testare va fi mai aproape de una dintre cozile distribuției dvs. în formă de clopot.

Dr. Fisher a decis să stabilească pragul de semnificație la p ≤ 0,05. Cu toate acestea, această afirmație este controversată, deoarece duce la două dificultăți:

1. În primul rând, faptul că ați dovedit că ipoteza nulă este falsă nu înseamnă că ați dovedit ipoteza alternativă. Toată această semnificație înseamnă doar că nu poți dovedi nici A, nici B.

2. În al doilea rând, dacă scorul p este 0,049, va însemna că probabilitatea ipotezei nule va fi de 4,9%. Acest lucru poate însemna că rezultatele testelor dvs. pot fi atât adevărate, cât și false în același timp.

Puteți utiliza sau nu scorul p, dar atunci va trebui să calculați probabilitatea ipotezei nule de la caz la caz și să decideți dacă este suficient de mare pentru a vă împiedica să faceți modificările planificate și testate. .

Cel mai comun scenariu pentru efectuarea unui test statistic astăzi este stabilirea unui prag de semnificație de p ≤ 0,05 înainte de a rula testul în sine. Asigurați-vă că vă uitați îndeaproape la valoarea p atunci când verificați rezultatele.

Erori 1 și 2

A trecut atât de mult timp încât erorile care pot apărea atunci când se utilizează metrica semnificației statistice au primit chiar propriile nume.

Erori de tip 1

După cum sa menționat mai sus, o valoare p de 0,05 înseamnă că există o șansă de 5% ca ipoteza nulă să fie adevărată. Dacă nu o faceți, veți face greșeala numărul 1. Rezultatele spun că noul dvs. site web v-a crescut ratele de conversie, dar există o șansă de 5% să nu fie așa.

Erori de tip 2

Această eroare este opusul erorii 1: acceptați ipoteza nulă atunci când este falsă. De exemplu, rezultatele testelor vă spun că modificările aduse site-ului nu au adus îmbunătățiri, în timp ce au existat modificări. Ca urmare, pierzi ocazia de a-ți îmbunătăți performanța.

Această eroare este frecventă în testele cu o dimensiune insuficientă a eșantionului, așa că rețineți: cu cât eșantionul este mai mare, cu atât rezultatul este mai fiabil.

Concluzie

Poate că niciun termen nu este la fel de popular printre cercetători ca semnificația statistică. Atunci când rezultatele testelor nu sunt considerate semnificative din punct de vedere statistic, consecințele variază de la o creștere a ratelor de conversie până la prăbușirea unei companii.

Și din moment ce specialiștii în marketing folosesc acest termen atunci când își optimizează resursele, trebuie să știi ce înseamnă cu adevărat. Condițiile de testare pot varia, dar dimensiunea eșantionului și criteriile de succes sunt întotdeauna importante. Tine minte asta.