Основні статистичні характеристики ділять на дві основні групи: заходи центральної тенденції та характеристики варіації.

Центральну тенденцію вибіркидозволяють оцінити такі статистичні характеристики, як середнє арифметичне значення, мода, медіана.

Найбільш просто одержуваною мірою центральної тенденції є мода. Мода (Мо)- Це таке значення в безлічі спостережень, яке зустрічається найчастіше. У сукупності значень (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) модою є 9, тому що воно зустрічається частіше за будь-яке інше значення. У випадку, коли всі значення групи зустрічаються однаково часто, вважають, що ця група не має моди.

Коли два сусідніх значення ранжированном ряду мають однакову частоту і вони більше частоти будь-якого іншого значення, мода є середнє цих двох значень.

Якщо два несуміжні значення в групі мають рівні частоти, і вони більші за частоти будь-якого значення, то існують дві моди (наприклад, у сукупності значень 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами є 11 і 14); у такому разі група вимірів або оцінок є бімодальної.

Найбільшою модою групи називається єдине значення, яке задовольняє визначенню моди. Однак у всій групі може бути менших мод. Ці менші моди є локальні вершини розподілу частот.

Медіана (Me)– середина ранжованого низки результатів вимірів. Якщо дані містять парне число різних значень, то медіана є точка, що лежить посередині між двома центральними значеннями, коли вони впорядковані.

Середнє арифметичне значеннядля невпорядкованого ряду вимірювань обчислюють за такою формулою:

де . Наприклад, для даних 4,1; 4,4; 4,5; 4,7; 4,8 обчислимо:

.

Кожен із вище обчислених заходів центру є найбільш придатним для використання в певних умовах.

Мода обчислюється найпростіше – її можна визначити на око. Більше того, для великих груп даних це досить стабільна міра центру розподілу.

Медіана займає проміжне положення між модою та середнім з погляду її обчислення. Цей захід виходить особливо легко у разі ранжованих даних.

Середня кількість даних передбачає переважно арифметичні операції.

На величину середнього впливають значення всіх результатів. Медіана та мода не вимагають для визначення всіх значень. Подивимося, що станеться із середнім, медіаною та модою, коли подвоїться максимальне значення в наступній множині:

Безліч 1: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

Безліч 2: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

На величину середнього впливають результати, які називають “викидами”, тобто. дані, що знаходяться далеко від центру групи оцінок.

Обчислення моди, медіани чи середнього – суто технічна процедура. Однак вибір із цих трьох заходів та їх інтерпретація найчастіше вимагають певного роздуму. У процесі вибору слід встановити таке:

– у малих групах мода може бути нестабільною. Наприклад, мода групи: 1, 1, 1, 3, 5, 7, 7, 8 дорівнює 1; але якщо одна з одиниць перетвориться на нуль, а інша – на дві, то мода дорівнюватиме 7;

– на медіану не впливають величини “великих” та “малих” значень. Наприклад, у групі із 50 значень медіана не зміниться, якщо найбільше значення потроїться;

- На величину середнього впливає кожне значення. Якщо якесь значення змінюється на c одиниць, зміниться у тому напрямі на c/n одиниць;

– деякі множини даних не мають центральної тенденції, що часто вводить в оману при обчисленні лише одного заходу центральної тенденції. Особливо це справедливо для груп, що мають більш ніж одну моду;

– коли вважають, що група даних є вибіркою з великої симетричної групи, середня вибірка, ймовірно, ближче до центру великої групи, ніж медіана та мода.

Усі середні показники дають загальну характеристику низки результатів вимірів. Насправді нас часто цікавить, як кожен результат відхиляється від середнього значення. Однак легко можна уявити, що дві групи результатів вимірів мають однакові середні, але різні значення вимірів. Наприклад, ряду 3, 6, 3 – середнє значення = 4; для ряду 5, 2, 5 – також середнє значення = 4, попри істотне відмінність цих рядів.

Тому середні характеристики завжди необхідно доповнювати показниками варіації чи коливання.

До характеристик варіації, або коливання, до результатів вимірювань відносять розмах варіювання, дисперсію, середнє квадратичне відхилення, коефіцієнт варіації, стандартну помилку середньої арифметичної.

Найпростішою характеристикою варіації є розмах варіювання. Його визначають як різницю між найбільшим та найменшим результатами вимірювань. Однак він уловлює лише крайні відхилення, але не відбиває відхилень усіх результатів.

Щоб дати узагальнювальну характеристику, можна визначити відхилення від середнього результату. Наприклад, ряду 3, 6, 3 значення будуть такими: 3 – 4 = – 1; 6 - 4 = 2; 3 – 4 = – 1. Сума цих відхилень (– 1) + 2 + (– 1) завжди дорівнює 0. Щоб уникнути цього, значення кожного відхилення зводять у квадрат: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Значення робить відхилення від середньої виразнішими: малі відхилення стають ще менше (0,5 2 =0,25), а великі – ще більше (5 2 = 25). Суму, що вийшла, називають сумою квадратів відхилень. Розділивши цю суму на число вимірів, одержують середній квадрат відхилень, або дисперсію. Вона позначається s 2 і обчислюється за такою формулою:

.

Якщо кількість вимірів трохи більше 30, тобто. n ≤ 30, використовується формула:

.

Розмір n – 1 = k називається числом ступенів свободи, Під яким мається на увазі кількість вільно варіюють членів сукупності. Встановлено, що з обчисленні показників варіації один член емпіричної сукупності не має ступеня свободи.

Ці формули застосовуються, коли результати представлені невпорядкованою (звичайною) вибіркою.

З характеристик коливання найчастіше використовується середнє квадратичне відхилення, Яке визначається як позитивне значення кореня квадратного значення дисперсії, тобто:

.

Середнє квадратичне відхиленняабо стандартне відхиленняхарактеризує ступінь відхилення результатів від середнього значення абсолютних одиницях і має самі одиниці виміру, як і результати виміру.

Однак для порівняння коливання двох і більше сукупностей, що мають різні одиниці виміру, ця характеристика не придатна.

Коефіцієнт варіаціївизначається як відношення середнього квадратичного відхилення до середнього арифметичного, виражене у відсотках. Обчислюється він за такою формулою:

.

У спортивній практиці коливання результатів вимірювань в залежності від величини коефіцієнта варіації вважають невеликим
(0 – 10 %), середньої (11 – 20 %) та великої (V > 20 %).

Коефіцієнт варіації має велике значення в статистичній обробці результатів вимірювань, тому що, будучи відносною величиною (вимірюється у відсотках), дозволяє порівнювати між собою коливання результатів вимірювань, що мають різні одиниці вимірювання. p align="justify"> Коефіцієнт варіації можна використовувати лише в тому випадку, якщо вимірювання виконані в шкалі відносин.

2.4.2. Аналіз статистичних даних у MS Excel. Інструменти аналізу: описова статистика, кореляція.

До складу електронних таблиць Microsoft Excel входить так званий пакет аналізу – набір інструментів, призначений на вирішення складних статистичних завдань. Даний пакет проводить аналіз статистичних даних за допомогою макрофункцій і дозволяє, виконавши одну дію, отримати на виході велику кількість результатів. У пакеті аналізу, що є в Excel, серед інших інструментів аналізу є розділи «Описова статистика» та «Кореляція».

Інструмент «Описова статистика» дозволяє отримати значний перелік розрахованих статистичних характеристик для великої кількості числових рядів. За допомогою інструмента "Кореляція" ми отримуємо кореляційну матрицю, що містить усі можливі парні коефіцієнти кореляції. Для k рядів буде отримано k (k – 1)/2 коефіцієнтів кореляції.

Пакет аналізу викликається за допомогою пункту меню Сервіс – Аналіз даних… Якщо цей пункт меню відсутній, то пакет аналізу не встановлено. Для його встановлення потрібно викликати пункт меню Сервіс – Надбудови… та увімкнути надбудову «Пакет аналізу», ОК (див. рисунок 1).

Рисунок 1. Діалогове вікно увімкнення/вимкнення надбудов

Після увімкнення надбудови «Пакет аналізу» буде доступний пункт меню Сервіс – Аналіз даних… При виборі з'являється наступне діалогове вікно (рисунок 2).

Рисунок 2. Діалогове вікно вибору інструменту для аналізу даних

Після вибору інструмента «Описова статистика» та натискання ОК з'явиться ще одне діалогове вікно (рисунок 3), яке потребує введення вхідних даних та місця виведення результатів. Тут достатньо в полі "Вхідний інтервал" ввести діапазон осередків, що містять вихідні дані. Можна вказати діапазон із заголовками стовпців, у цьому випадку потрібно увімкнути прапорець "Мітки в першому рядку". Для вказівки вихідного інтервалу достатньо вказати лише ліву верхню комірку діапазону. Результати обчислення автоматично займуть потрібну кількість рядків та стовпців у таблиці.

Рисунок 3. Діалогове вікно інструменту «Описова статистика»

Розглянемо роботу інструменту аналізу «Описова статистика» на прикладі. У процесі обстеження групи школярів (n = 21) вимірювалися такі показники: зростання, маса тіла, динамометрія правої та лівої руки, життєва ємність легень, проба Штанге та проба Генчі. Результати було занесено до таблиці (рисунок 4).

Для отримання статистичних характеристик скористаємося пакетом аналізу інструментом «Описова статистика». У поле «Вхідний інтервал» занесемо діапазон осередків В1: Н22. Оскільки виділений вхідний інтервал містить заголовки стовпців, включаємо прапорець «Мітки у першому рядку». Для зручності роботи в якості місця результату вибираємо «Новий робочий лист». Як виведені дані відзначимо прапорцями «Підсумкова статистика» і «Рівень надійності: 95%». Останній прапорець дозволить вивести параметри довірчого інтервалу з вірогідністю 0,95. Отриманий результат після невеликого форматування буде виглядати так, як показано на малюнку 5.

Рисунок 4. Результати обстеження групи школярів

Рисунок 5. Результат роботи інструменту «Описова статистика»

Після вибору інструмента «Кореляція» та натискання ОК у діалоговому вікні «Аналіз даних» (малюнки 2, 6) з'явиться ще одне діалогове вікно (малюнок 7), яке потребує введення вхідних даних та місця виведення результатів. Тут достатньо в полі "Вхідний інтервал" ввести діапазон осередків, що містять вихідні дані. Можна вказати діапазон із заголовками стовпців, у цьому випадку потрібно увімкнути прапорець "Мітки в першому рядку". Для вказівки вихідного інтервалу достатньо вказати тільки ліву верхню комірку діапазону. Результати обчислення автоматично займуть потрібну кількість рядків та стовпців у таблиці.

Рисунок 6. Діалогове вікно вибору інструменту для аналізу даних

Рисунок 7. Діалогове вікно інструменту «Кореляція»

Розглянемо роботу інструменту аналізу «Кореляція» з прикладу, представленому малюнку 4.

Для отримання кореляційної матриці скористаємося пакетом аналізу інструментом «Кореляція». У поле «Вхідний інтервал» занесемо діапазон осередків В1: Н22. Оскільки виділений вхідний інтервал містить заголовки стовпців, включаємо прапорець «Мітки у першому рядку». Для зручності роботи в якості місця результату вибираємо «Новий робочий лист». Отриманий результат після невеликого форматування виглядатиме так, як показано на малюнку 8.

Малюнок 8. Кореляційна матриця

Таким чином, шляхом виконання нескладних операцій ми отримуємо велику кількість результатів обчислень. Варто зазначити, що хоч інформаційні технології відкривають перед дослідником можливості отримання величезної кількості інформації для аналізу, відбір найбільш інформативних результатів, остаточна інтерпретація та формулювання висновків – робота самого дослідника.

Основні поняття кореляційного аналізу експериментальних даних. Оцінка коефіцієнта кореляції за експериментальними даними.

У спортивних дослідженнях між показниками, що вивчаються, часто виявляється взаємозв'язок. Вигляд її буває різним. Наприклад, визначення прискорення за відомими даними швидкості, другий закон Ньютона та інші характеризують так звану функціональнузалежність, чи взаємозв'язок, коли він кожному значенню одного показника відповідає строго певне значення іншого.

До іншого виду взаємозв'язку відносять, наприклад, залежність ваги від довжини тіла. Одному значенню довжини тіла може відповідати кілька значень ваги та навпаки. У разі, коли одному значенню одного показника відповідає кілька значень іншого, взаємозв'язок називають статистичної.

Вивченню статистичного взаємозв'язку між різними показниками у спортивних дослідженнях приділяють велику увагу, оскільки це дозволяє розкрити деякі закономірності й надалі описати їх як словесно, і математично з метою використання у практичній роботі тренера і педагога.

Серед статистичних взаємозв'язків найважливіші кореляційні. Кореляція – це статистична залежність між випадковими величинами, коли він зміна однієї з випадкових величин призводить до зміни математичного очікування (середнього значення) інший. Наприклад, штовхання ядра 3 кг та 5 кг. Поліпшення результатів штовхання ядра 3 кг викликає поліпшення (в середньому) результату штовхання ядра вагою 5 кг.

Статистичний метод, який використовується для дослідження взаємозв'язків, називається кореляційним аналізом. Основним завданням його є визначення форми, тісноти та спрямованостівзаємозв'язку досліджуваних показників. Кореляційний аналіз дозволяє досліджувати лише статистичну взаємозв'язок. Він широко використовується в теорії тестів для оцінки їхньої надійності та інформативності. Різні шкали вимірів потребують різних варіантів кореляційного аналізу.

Розмір коефіцієнта взаємозв'язку розраховується з урахуванням шкали, використаної вимірювань.

Для оцінки взаємозв'язку, коли виміри виробляють у шкалі відносин або інтервалів і форма взаємозв'язку лінійна, використовується коефіцієнт кореляції Браве-Пірсона (коефіцієнти кореляції для інших шкал виміру в даному посібнику не розглядаються). Позначається він латинською літерою – r. Обчислення значення r найчастіше виробляють за такою формулою:

,

де і – середні арифметичні значення показників x та y, і – середні квадратичні відхилення, n- Число вимірювань (випробуваних).

У деяких випадках тісноту взаємозв'язку визначають на підставі коефіцієнта детермінації D, який обчислюється за такою формулою:

.

Цей коефіцієнт визначає частину загальної варіації одного показника, що пояснюється варіацією іншого показника. Наприклад, коефіцієнт кореляції r = -0,677 (між результатами в бігу на 30 м з ходу і потрійному стрибку з місця). Коефіцієнт детермінації дорівнює:

Отже, 45,8% розсіювання спортивного результату в потрійному стрибку пояснюється зміною результатів у бігу на 30 м. Іншими словами, на обидва досліджувані ознаки діють загальні фактори, що викликають варіювання цих ознак, і частка загальних факторів становить 45,8%. Інші 100% - 45,8% = 54,2% припадають на частку факторів, що діють на досліджувані ознаки вибірково.

Оцінити статистичну достовірність коефіцієнта кореляції – це означає визначити, існує чи ні лінійний кореляційний зв'язок між генеральними сукупностями або, що те саме, встановити, чи істотно чи несуттєво відрізняється від нуля коефіцієнт кореляції між вибірками. Це завдання можна вирішити з допомогою таблиць критичних точок розподілу коефіцієнта кореляції у порядку:

1. Висуваються статистичні гіпотези. Гіпотеза Н 0 передбачає відсутність статистично значущого взаємозв'язку між досліджуваними показниками ( r ген=0). Гіпотеза Н 1 передбачає, що існує статистично достовірний взаємозв'язок між показниками ( r ген>0).

2. Розраховується значення коефіцієнта кореляції, що спостерігається. r набл.

3. Знаходиться за таблицею критичне значення коефіцієнта кореляції r критзалежно від обсягу вибірки n, рівня значимості a та виду критичної області (одностороння або двостороння).

3. Порівнюється r наблі r крит.

Якщо r набл < r крит- Статистично недостовірним (незначним). Приймається гіпотеза Н 0 Якщо r наблr крит, Коефіцієнт кореляції вважається статистично достовірним (значущим). Приймається гіпотеза Н1.

У всьому світі інтерес до статистики зростає. У наш час ця увага більш загострена у зв'язку з ухваленням низки економічних реформ, які торкаються інтересів багатьох громадян.

Загальна теорія статистики є однією з дисциплін, що формує фахівців високого рангу, а саме фінансистів та менеджерів. Статистика тісно пов'язана з економічними та фінансовими дисциплінами, маркетингом, менеджментом, що забезпечують сучасну фундаментальну підготовку фахівців.

Після вивчення курсу про Статистику повинні засвоїти наступні етапи:

  • основні етапи статистичного дослідження, їх зміст;
  • знання основних формул і залежність, що використовуються при аналізі статистичних даних, уміння аналізувати та знаходити залежності у явищах, що вивчаються;
  • мати уявлення про порядок проведення зведень та угруповань статистичних даних; методи збору та обробки первинної статистичної інформації для проведення якісного економічного аналізу; вміти перевіряти достовірність первинних даних у формах статистичної звітності;
  • виробляти практичні навички щодо статистичного дослідження;
  • знати методи обчислення основних статистичних показників

Визначення

Статистика - це наука, яка займається отриманням, обробкою та аналізом кількісних даних про різноманітні явища, що відбуваються в природі та суспільстві.

У повсякденному житті ми часто чуємо таке поєднання, як статистика захворювань, статистика про аварії, статистика про розлучення, статистика про народонаселення та ін.

Основним завданням статистики є належне опрацювання інформації. Безсумнівно, статистика має багато інших завдань: отримання та зберігання інформації, надання різних прогнозів, їх оцінка і достовірність. Але жодна з цих цілей не досягне без обробки даних. Тому перше, на що варто звернути увагу – це статистичні методи обробки інформації. І тому існує багато термінів, прийнятих у статистиці.

Визначення

Математична статистика - розділ у математиці, у якому йдеться про методи та правила обробки та аналізу статистичних даних.

Історичні дані

Початок науки під назвою «Математична статистика» покладено знаменитим німецьким математиком Карлом Фрідріхом Гауссом (1777-1855), який на підставі теорії ймовірності зміг дослідити та обґрунтувати метод найменших квадратів, який створив у 1795 році та застосував його для обробки астрономічних даних. За допомогою його імені досить часто називають один із відомих розподілів ймовірностей, який має назву нормальна, а в теорії випадкових процесів основним об'єктом вивчення є гауссівські процеси.

У ХІХ ст. – ХХ ст. вагоме вкладення математичну статистику вніс англійський учений К.Пірсон (1857-1936) і Р.А.Фишер (1890-1962). Зокрема, Пірсон розробив критерій щодо «хі-квадрат» перевірки статистичних гіпотез, а Фішер – дисперсійний аналіз, теорію планування експерименту, метод максимальної правдоподібності оцінки параметрів.

У 30-х роках ХХ століття поляк Єжи Нейман (1894-1977) та англієць Е.Пірсон вивели взаємну теорію перевірки статистичних гіпотез, а радянські математики академік О.М. Колмогоров (1903-1987) та член-кореспондент АН СРСР Н.В.Смирнов (1900-1966) поклали основи непараметричної статистики.

У сорокових роках ХХ ст. Математик із Румунії А. Вальд (1902-1950) заснував теорію послідовного статистичного аналізу.

Математична статистика не перестає розвиватися й у час.

Будь-яке статистичне дослідження можна поділити на три етапи: статистичне спостереження, зведення та угруповання матеріалів, отриманих у результаті спостереження.

Статистичне спостереження

Статистичне спостереження розрізняють за способами та видами проведення. Наведемо їхню класифікацію:

  1. За ступенем охоплення одиниць досліджуваної сукупності:
    1. Суцільне спостереження, тоді як охоплюють всі одиниці сукупності (наприклад, поточна звітність підприємстві, перепис населення).
    2. Часткове (не суцільне) спостереження обстеженням охоплює певну частину сукупності, яка вивчається.
  2. Статистичне спостереження залежно від часу може бути безперервним, періодичним та одноразовим.
    1. Безперервне спостереження – це таке, що проходить безперервно, з виникненням явищ, прикладом є облік випуску продукції для підприємства;
    2. Періодичне спостереження – це спостереження, яке відбувається через деякі проміжки часу, прикладом є сесія в університеті.
    3. Одноразове спостереження - це спостереження, що проходить при необхідності, прикладом є перепис населення.
  3. Залежно від джерела даних, що збираються, розрізняють:
    1. Безпосереднє спостереження, спостереження, яке проводиться особисто реєстратором - зняття товарних залишків, вивчення та вимір норм часу;
    2. Документальне спостереження, тоді, коли використовують документи різноманітних;
    3. Спостереження базується на опитуванні осіб, що цікавляться, і отримання даних у формі відповідей.
  4. За способом організації розрізняють такі спостереження:
    1. Ті, які полягають у обробці звітних даних, звітність найбільш поширена в практиці роботи.
    2. Експедиційний спосіб - до кожної одиниці сукупності прикріплюється спеціальна особа, яка фіксує відомості, що є необхідними;
    3. Заповнення спеціальних бланків – самореєстрація;
    4. Спосіб Анкетування - розсилка анкет та їх подальша обробка.

Найпоширенішою формою статистичного спостереження є подання звітності. Види статистичної звітності можна поділити на типову та спеціалізовану; за періодичністю розрізняють тижневу, місячну, квартальну та річну звітності.

Класифікація помилок

Визначення

Помилка – це розбіжність між результатами спостережень та справжніми значеннями величини, що досліджується.

Класифікація помилок:

  1. За характером помилки розрізняють:
    1. випадкові помилки, які викликаються будь-якими причинами. Випадкові помилки особливо впливають весь результат;
    2. систематичні помилки, спотворюють явище лише одну зі сторін більш небезпечні і, іноді, викликають дію систематичного чинника.
  2. За стадією виникнення:
    1. помилки під час реєстрації;
    2. помилки під час підготовки даних до обробки;
    3. помилки під час обробки.
  3. За причин виникнення:
    1. властиві лише вибірковому методу та пов'язані з неправильним вибором частини сукупності помилки репрезентативності;
    2. ненавмисні помилки, що відбуваються випадково або є метою спотворити результат спостереження;
    3. навмисні помилки трапляються внаслідок навмисного спотворення фактів. Усі спеціальні помилки є систематичними.

ЗМІСТ

Вступ. 2

Концепція статистики. 2

Історія математичної статистики. 3

Найпростіші статистичні характеристики. 5

Статистичні дослідження. 8

1. СЕРЕДНЕ АРИФМЕТИЧНЕ 9

2. РОЗМАХ 10

4. МЕДІАНА 11

5. СПІЛЬНЕ ЗАСТОСУВАННЯ СТАТИСТИЧНИХ ХАРАКТЕРИСТИК 11

Перспективи та висновок. 11

Список літератури. 12
Вступ.

У жовтні на перерві перед уроком наш учитель математики Маріанна Рудольфівна перевіряла самостійні роботи у 7 класу. Побачивши, про що вони пишуть, я не зрозуміла ні слова, але запитала Маріанну Рудольфівну, що означають незнайомі мені слова – розмах, мода, медіана, середнє. Отримавши відповідь, я нічого не зрозуміла. Під кінець 2 чверті Маріанна Рудольфівна запропонувала комусь із нашого класу зробити реферат на цю тему. Мені здалася ця робота дуже цікавою, і я погодилася.

У ході роботи розглядалися такі питання

Що таке математична статистика?

У чому значення статистики для звичайної людини?

Де застосовуються отримані знання?

Чому людина не може обійтися без математичної статистики?

Концепція статистики.

СТАТИСТИКА - це наука, яка займається отриманням, обробкою та аналізом кількісних даних про різноманітні явища, що відбуваються в природі та суспільстві.

У засобах масової інформації найчастіше зустрічаються такі фрази, як статистика аварій, статистика народонаселення, статистика захворювань, статистика розлучень та інших.

Одне з основних завдань статистики полягає у належній обробці інформації. Звичайно, у статистики є багато інших завдань: отримання та зберігання інформації, вироблення різних прогнозів, оцінка їх достовірності і т. д. Жодна з цих цілей недосяжна без обробки даних. Тому перше, чим варто зайнятися – це статистичними методами обробки інформації. І тому є багато термінів, прийнятих у статистиці.

МАТЕМАТИЧНА СТАТИСТИКА - розділ математики, присвячений методам та правилам обробки та аналізу статистичних даних

Історія математичної статистики.

Математична статистика як наука починається з робіт знаменитого німецького математика Карла Фрідріха Гауса (1777-1855), який на основі теорії ймовірностей досліджував та обґрунтував метод найменших квадратів, створений ним у 1795 р. та застосований для обробки астрономічних даних (з метою уточнення орбіти малої Церера). Його ім'ям часто називають один із найбільш популярних розподілів ймовірностей – нормальний, а в теорії випадкових процесів основний об'єкт вивчення – гауссівські процеси.

Наприкінці ХІХ ст. – на початку ХХ ст. великий внесок у математичну статистику зробили англійські дослідники, передусім К.Пірсон (1857-1936) та Р.А.Фішер (1890-1962). Зокрема Пірсон розробив критерій «хі-квадрат» перевірки статистичних гіпотез, а Фішер – дисперсійний аналіз, теорію планування експерименту, метод максимальної правдоподібності оцінки параметрів.

У 30-ті роки ХХ століття поляк Єжи Нейман (1894-1977) та англієць Е.Пірсон розвинули загальну теорію перевірки статистичних гіпотез,

а радянські математики академік О.М. Колмогоров (1903-1987) та член-кореспондент АН СРСР Н.В.Смирнов (1900-1966) заклали основи непараметричної статистики.

У сорокові роки ХХ ст. румунський математик А. Вальд (1902–1950) побудував теорію послідовного статистичного аналізу.

Математична статистика бурхливо розвивається й у час.

^ Найпростіші статистичні характеристики.

У повсякденному житті ми, не здогадуючись, використовуємо такі поняття як медіана, мода, розмах та середнє арифметичне. Навіть коли ми ходимо до магазину чи робимо прибирання.

^ Середнім арифметичним ряду чисел називається частка від поділу суми цих чисел на їх кількість. Середнє арифметичне є важливою характеристикою низки чисел, але іноді корисно розглядати й інші середні.

Модою називають число ряду, яке зустрічається в цьому ряду найчастіше. Можна сміливо сказати, що це число «модне» у цьому ряду. Такий показник, як мода, використовується як для числових даних. Якщо, наприклад, опитати велику групу учнів, який шкільний предмет їм подобається найбільше, то модою цієї низки відповідей виявиться той предмет, який називатимуть найчастіше.

Мода – показник, який широко використовується у статистиці. Одним із найчастіших використань моди є вивчення попиту. Наприклад, при вирішенні питань, в пачки якої ваги фасувати масло, які відкривати авіарейси і т. п., попередньо вивчається попит і виявляється мода - замовлення, що найчастіше зустрічається.

Зауважимо, що у лавах, що розглядаються у реальних статистичних дослідженнях, іноді виділяють більше однієї моди. Коли в ряді багато даних, то цікавими бувають усі значення, які зустрічаються набагато частіше за інших. Їхні статистики теж називають модою.

Проте перебування середнього арифметичного чи моди які завжди дозволяє робити надійні висновки з урахуванням статистичних даних. Якщо є ряд даних, то, крім середніх значень, треба ще вказати, наскільки дані різняться між собою.

Одним із статистичних показників відмінності або розкиду даних є розмах.

Розмах - це різниця між найбільшим та найменшим значеннями ряду даних.

Ще однією важливою статистичною характеристикою низки даних є медіана. Зазвичай медіану шукають у разі, коли числа в ряду є якими-небудь показниками і треба знайти, наприклад, людину, що показала середній результат, фірму із середнім річним прибутком, авіакомпанію, що пропонує середні ціни на квитки, і т.д.

Медіаною ряду, що складається з непарної кількості чисел, називається число даного ряду, яке виявиться посередині, якщо цей ряд упорядкувати. Медіаною ряду, що складається з парної кількості чисел, називається середнє арифметичне двох чисел цього ряду, що стоять посередині.

Наприклад:

1. У школах м. Пермі щороку проходить ЕРТ за 4 клас та у 2010 році були отримані такі середні бали:

Математика

Російська мова

Гімназія №4

Моя мати працює на пермському пороховому заводі бухгалтером. Зарплата співробітників цього підприємства коливається у розмірі від 12000 до 18000. різниця становить 6000. Це називається розмах

Декілька років тому ми з батьками відпочивали на півдні в Анапі. Я звернула увагу, що на номерах машин найчастіше трапляється №23 – номер регіону. Це називається мода.

На виконання домашнього завдання я витрачала протягом тижня такий час – 60 хв у понеділок, у вівторок 103 хв, у середу 58, у четвер 76, а у п'ятницю 89 хв. Записавши ці числа від найменшого до більшого, посередині стоїть число 76 – це називається медіана.

Статистичні дослідження.

"Статистика знає все", - стверджували Ільф і Петров у своєму знаменитому романі "Дванадцять стільців" і продовжували: "Відомо, скільки якої їжі з'їдає в рік середній громадянин республіки ... Відомо, скільки в країні мисливців, балерин ... верстатів, велосипедів, пам'ятників, маяків і швейних машинок... Як багато життя, повного запалу, пристрастей та думки, дивиться на нас зі статистичних таблиць!..» Навіщо потрібні ці таблиці, як їх складати та обробляти, які висновки на їх основі можна робити - На ці питання відповідає статистика (від італійського stato - держава, латинського status - стан).

^ 1. СЕРЕДНЕ АРИФМЕТИЧНЕ
Я вирахувала середні витрати на електроенергію у нашій сім'ї протягом 2010 року:

Витрата, кВт/год

(189 + 155 * 2 + 106 * 2 + 102 + 112 * 2 + 138 + 160 + 156 + 149): 12 = 136 - середнє арифметичне

^ Коли потрібно і не потрібне середнє арифметичне?

Має сенс обчислювати середні витрати в сім'ї на продукти, середню врожайність картоплі на городі, середні витрати на продукти, щоб зрозуміти, як робити наступного разу, щоб не було великого перевитрати, середню оцінку за чверть – по ній поставлять оцінку за чверть.

Немає сенсу обчислювати середню зарплату моєї мами та Абрамовича, середню температуру здорової та хворої людини, середній розмір взуття у мене та у мого брата.
2. РОЗМАХ
Зростання дівчаток нашого класу найрізноманітніший:

151 см, 160 см, 163 см, 162 см, 145 см, 130 см, 131 см, 161 см

Розмах становить 163 - 130 = 33 см. Розмах визначає різницю у зростанні.

^ Коли потрібен і не потрібен розмах?

Розмах ряду знаходять тоді, коли хочуть визначити, наскільки великий розкид даних у ряду. Наприклад, протягом доби відзначали щогодини температуру повітря у місті. Для отриманого ряду даних корисно не тільки обчислювати середнє арифметичне, що показує, яка середньодобова температура, але і знайти розмах ряду, що характеризує коливання температури повітря протягом цієї доби. Для температури на Меркурії, наприклад, розмах дорівнює 350 + 150 = 500 С. Звичайно такого перепаду температур людина витримати не може.

3. МОДА
Я виписала свої оцінки за грудень з математики:

4,5,5,4,4,4,4,5,5,4,5,5,4,5,5,5,5,5,5. Виявилось, що я отримала:

"5" - 7, "4" - 5, "3" - 0, "2" - 0

Мода дорівнює 5.

Але мода буває не одна, наприклад, за природознавством у жовтні я мав такі оцінки – 4,4,5,4,4,3,5,5,5. Мод тут дві – 4 та 5

Коли потрібна мода?

Мода важлива для виробників щодо найпопулярнішого розміру одягу, взуття, розмірів пляшки соку, пачки чіпсів, популярного фасону одягу

4. МЕДІАНА
При аналізі результатів, показаних учасниками забігу учнів класу на 100 метрів знання медіани дозволяє вчителю фізкультури виділити для участі у змаганнях групу хлопців, які показали результат вище серединного.

^ Коли потрібна і не потрібна медіана?

Медіана частіше застосовується з іншими статистичними характеристиками, але за нею однією можна відбирати результати вище або нижче медіани

^ 5. СПІЛЬНЕ ЗАСТОСУВАННЯ СТАТИСТИЧНИХ ХАРАКТЕРИСТИК
У нашому класі за останню перевірочну роботу з математики на тему «Вимірювання кутів та їх види» було отримано такі оцінки: «5» - 10, «4» - 5, «3» - 7, «2» - 1.

Середнє арифметичне – 4.3, розмах – 3, мода – 5, медіана – 4.

^ Перспективи та висновок.

Статистичні характеристики дозволяють вивчати числові ряди. Тільки всі разом вони можуть дати об'єктивну оцінку ситуації

Не можна правильно організовувати наше життя, не знаючи законів математики. Вона дозволяє вивчати, впізнавати, виправляти.

Статистика створює фундамент точних та безперечних фактів, який необхідний для теоретичних та практичних цілей.

Математики винайшли статистику тому, що вона була потрібна суспільству

Думаю, що знання, отримані при роботі над цією темою, стануть у нагоді мені в подальшому навчанні і в житті.

Вивчаючи літературу, я дізналася, що є такі характеристики, як середнє квадратичне відхилення, дисперсія та інші.

Однак моїх знань недостатньо, щоби в них розібратися. Про них – у майбутньому.

^ Список літератури.
Навчальний посібник для учнів 7-9 класів загальноосвітніх установ «Алгебра. Елементи статистики та теорії ймовірностей». Ю.Н.Макаричов, Н.Г.Міндюк, за редакцією С.А.Теляковського; Москва. Просвітництво. 2005 р.

Статті із додатку до газети «Перше вересня. Математика».

Енциклопедичний СЛОВНИК ЮНОГО МАТЕМАТИКА

http://statist.my1.ru/

http://art.ioso.ru/seminar/2009/projects11/rezim/stat1.html

Одне з основних завдань статистики полягає у належній обробці інформації. Звичайно, у статистики є багато інших завдань: отримання та зберігання інформації, вироблення різних прогнозів, оцінка їх достовірності і т. д. Але жодна з цих цілей недосяжна без обробки даних. Тому спочатку необхідно виділити основні характеристики статистичних даних.

Електронні таблиці Excel мають величезний набір коштів на аналізу статистичних даних. Статистичні функції, що найчастіше використовуються, вбудовані в основне ядро ​​програми, тобто ці функції доступні з моменту запуску програми. Інші спеціалізовані функції входять у додаткову підпрограму, звану пакетом аналізу. Команди та функції пакету аналізу називають інструментами аналізу.

Розглянемо основні характеристики вибіркових даних.

Середнє значення.

З допомогою середнього значення обчислюють вибіркове (чи генеральне) середнє, тобто середнє арифметичне значення ознаки вибіркової (чи генеральної) сукупності. В Excel середнє значення обчислюється так: = СУМ (F4: F60) / РАХУНОК (F4: F60). Також у Excel існує функція його обчислення: СРЗНАЧ. Аргументом функції є набір чисел, як правило, що задається у вигляді інтервалу осередків, наприклад: = СРЗНАЧ (А3: А201).

Вибіркова дисперсія та вибіркове середнє квадратичне відхилення.

Вибірковою дисперсією значень випадкової величини Хназивається середнє арифметичне квадратів відхилень значень цієї величини, що спостерігаються, від їх середнього арифметичного:

Дисперсія характеризує відхилення від середньої у квадратних одиницях вимірювання ознаки, тому використовують такий показник, як середнє квадратичне відхилення, який вимірюється в тих самих одиницях, що й ознака, що вивчається.

Вибіркове середнє квадратичне відхилення визначається формулою:

Excel є функції, що окремо обчислюють вибіркову дисперсію стандартне відхилення вта генеральні дисперсію Dг та стандартне відхилення р. Тому, перш ніж обчислювати дисперсію та стандартне відхилення, слід чітко визначитися, чи є ваші дані генеральною сукупністю чи вибірковою. Залежно від цього необхідно використовувати для розрахунку Dг і г, і в.

Обчислення вибіркової дисперсії та вибіркового стандартного відхилення впроводиться за допомогою функцій: = СУМ((4: 60 ? 28)^2)/ (РАХУНОК(4: 60)) і = КОРІНЬ(29).

В Excel є функції ДИСП (або VAR) та СТАНДОТКЛОН (або STDEV).

Аргументом цих функцій є набір чисел, зазвичай, заданий діапазоном осередків, наприклад, =ДИСП (В1:В48).

Для обчислення генеральної дисперсії Dг та генерального стандартного відхилення г є функції ДИСПР (або VARP) та СТАНДОТКЛОНП (або STDEVP), відповідно.

Аргументи цих функцій такі ж, як для вибіркової дисперсії.

Об'єм сукупності.

Обсяг сукупності вибіркової чи генеральної – це кількість елементів сукупності. Функція РАХУНОК (або COUNT) визначає кількість осередків у заданому діапазоні, які містять числові дані. Порожні осередки або осередки, що містять текст, функція РАХУНОК пропускає. Аргументом функції РАХУНОК є інтервал осередків, наприклад: =РАХУНОК (С2:С16).

Для визначення кількості непустих осередків, незалежно від їхнього вмісту, використовується функція РАХУНОК3. Її аргументом є інтервал осередків.

Мода та медіана.

Мода (?) – це значення ознаки, яке найчастіше зустрічається в сукупності даних. Вона обчислюється функцією МОДА (або MODE). Її аргументом є інтервал осередків із даними. Мода не обчислюється щодо НСВ.

Медіана (?) - Це значення ознаки, яке поділяє сукупність на дві рівні за кількістю елементів частини. Для варіаційного ряду з непарним числом членів медіана дорівнює серединному варіанту, а для ряду з парним числом членів - напівсумі двох серединних варіантів. Вона обчислюється функцією МЕДІАНУ (або MEDIAN). Її аргументом є інтервал осередків.

Розмах варіювання. Найбільше та найменше значення.

Розмах варіювання R- це різниця між найбільшим x max та найменшим xmin значеннями ознаки сукупності (генеральної або вибіркової): R=x max- x min.

Для знаходження найбільшого значення x max є функція МАКС (або MAX), а для найменшого x min - функція МІН (або MIN). Їхнім аргументом є інтервал осередків. Щоб обчислити розмах варіювання даних в інтервалі осередків, наприклад, від А1 до А100, слід запровадити формулу: =МАКС (А1:А100)-МИН (А1:А100).

Коефіцієнт варіації. Обчислюється як відсоткове співвідношення вибіркового середнього квадратичного відхилення до середньої арифметичної.

Якщо коефіцієнт варіації високий (понад 35%), то вибіркова сукупність вважається неоднорідною. Отже, використання середнього її характеристики є неправильним. У цьому випадку використовують моду чи медіану.

Для оцінки відхилення розподілу даних експерименту від нормального розподілу використовуються такі характеристики, як асиметрія Ата ексцес Е.

Для нормального розподілу А=0 і Е=0.

Асиметрія показує, наскільки розподіл даних несиметричний щодо нормального розподілу: якщо А>0, більшість даних має значення, перевищують середнє; якщо А<0, то большая часть данных имеет значения, меньшие среднего. Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Ексцес оцінює «крутість», тобто. величину більшого чи меншого підйому максимуму розподілу експериментальних даних, порівняно з максимумом нормального розподілу. Якщо Е>0, максимум експериментального розподілу вище нормального; якщо Е<0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100). [см. 5]

Отримуємо такі обчислення (рисунок 14).

Рисунок 14 Обчислення основних характеристик

Набули такі значення (рисунок 15).


Рисунок 15 Значення основних характеристик

Так як значення коефіцієнта варіації значно перевищує 35%, вибірка є неоднорідною і як середнє значення використовується медіана.

Статистика - одне з найдавніших галузей прикладної математики, що широко використовує теоретичну основу багатьох арифметичних визначень реалізації практичної діяльності. Ще у древніх державах виникла потреба суворого обліку доходу громадян за групами, щодо ефективного процесу оподаткування. Статистичні дослідження мають величезне значення для економічного розвитку суспільства, і не лише. Тому в даному відеоуроці ми розглянемо основні визначення статистичних характеристик.

Припустимо, нам потрібно вивчити статистику виконання тестів учнями сьомого класу. Для початку нам необхідно створити масив інформації, з якою можна працювати. Інформацією в даному випадку будуть цифри, що визначають кількість виконаних тестів кожним з учнів. Розглянемо два класи, які містять по 15 школярів кожен. Загальне завдання включало 10 вправ. Результати вийшли такими:

7А: 4, 10, 6, 4, 7, 8, 2, 10, 8, 5, 7, 9, 10, 6, 3;

7Б: 7, 5, 9, 7, 8, 10, 7, 1, 7, 6, 5, 9, 8, 10, 7.

Ми отримали, в математичній інтерпретації, дві множини чисел, що складаються з 15 елементів кожне. Цей інформаційний масив сам по собі мало чим може допомогти в оцінюванні ефективності виконання завдань. Тому його потрібно статистично перетворити. І тому введемо основні поняття статистики. Ряд чисел, отриманих у результаті дослідження, називається вибіркою. Кожне число (кількість виконаних вправ) – це варіанти вибірки. А кількість всіх чисел (у даному випадку, це 30 – сума всіх учнів в обох класах) є обсягом вибірки.

Однією з основних статистичних показників є середнє арифметичне. Це значення визначається як окреме, отримане в результаті розподілу суми значень варіант вибірки на її обсяг. У нашому випадку необхідно скласти всі отримані значення чисел і поділити їх на 15 (якщо ми обчислюємо середнє арифметичне для одного класу), або ж на 30 (якщо ми обчислюємо загальне середнє арифметичне). У прикладі, сума всіх кількостей виконаних завдань для класу 7А складе 99. Поділивши на 15, отримуємо 6,6 - це середнє арифметичне виконаних завдань для цієї групи учнів.

Працювати з хаотичним набором чисел не дуже зручно, тому часто інформаційний масив призводять до впорядкованого набору даних. Створимо варіаційний ряд для 7Б класу, використавши метод поступового зростання, маючи числа від меншого до більшого:

1, 5, 5, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10.

Кількість появ будь-якого одного значення у вибірці даних називається частотою варіанти вибірки. Наприклад, частота варіанти «7» у вищезгаданому варіаційному ряду легко визначається, і дорівнює вона п'яти. Для зручності відображення впорядкований ряд перетворюється на таблицю, що відображає залежність між стандартним рядом значень варіант, і частотою народження (кількістю учнів, що виконали однакову кількість завдань).

У 7А класі найменшою варіантом вибірки є значення "2", а найбільшою - "10". Інтервал між 2 та 10 називається розмахом варіаційного ряду. Для 7Б класу розмах ряду становить від 1 до 10. Найбільша, за частотою народження, варіанта називається модою вибірки - для 7А це число 7, що зустрічається 5 разів.