Основные статистические характеристики делят на две основные группы: меры центральной тенденции и характеристики вариации.

Центральную тенденцию выборки позволяют оценить такие статистические характеристики, как среднее арифметическое значение, мода, медиана.

Наиболее просто получаемой мерой центральной тенденции является мода. Мода (Мо) – это такое значение в множестве наблюдений, которое встречается наиболее часто. В совокупности значений (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) модой является 9, потому что оно встречается чаще любого другого значения. В случае, когда все значения в группе встречаются одинаково часто, считают, что эта группа не имеет моды.

Когда два соседних значения в ранжированном ряду имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений.

Если два несмежных значения в группе имеют равные частоты, и они больше частот любого значения, то существуют две моды (например, в совокупности значений 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются 11 и 14); в таком случае группа измерений или оценок является бимодальной .

Наибольшей модой в группе называется единственное значение, которое удовлетворяет определению моды. Однако во всей группе может быть несколько меньших мод. Эти меньшие моды представляют собой локальные вершины распределения частот.

Медиана (Me) – середина ранжированного ряда результатов измерений. Если данные содержат четное число различных значений, то медиана есть точка, лежащая посередине между двумя центральными значениями, когда они упорядочены.

Среднее арифметическое значение для неупорядоченного ряда измерений вычисляют по формуле:

где . Например, для данных 4,1; 4,4; 4,5; 4,7; 4,8 вычислим :

.

Каждая из выше вычисленных мер центра является наиболее пригодной для использования в определенных условиях.

Мода вычисляется наиболее просто – ее можно определить на глаз. Более того, для очень больших групп данных это достаточно стабильная мера центра распределения.

Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления. Эта мера получается особенно легко в случае ранжированных данных.

Среднее множество данных предполагает в основном арифметические операции.

На величину среднего влияют значения всех результатов. Медиана и мода не требуют для определения всех значений. Посмотрим, что произойдет со средним, медианой и модой, когда удвоится максимальное значение в следующем множестве:

Множество 1: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

Множество 2: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

На величину среднего особенно влияют результаты, которые называют “выбросами”, т.е. данные, находящиеся далеко от центра группы оценок.

Вычисление моды, медианы или среднего – чисто техническая процедура. Однако выбор из этих трех мер и их интерпретация зачастую требуют определенного размышления. В процессе выбора следует установить следующее:

– в малых группах мода может быть совершенно нестабильной. Например, мода группы: 1, 1, 1, 3, 5, 7, 7, 8 равна 1; но если одна из единиц превратится в нуль, а другая – в два, то мода будет равна 7;

– на медиану не влияют величины “больших” и “малых” значений. Например, в группе из 50 значений медиана не изменится, если наибольшее значение утроится;

– на величину среднего влияет каждое значение. Если одно какое-нибудь значение меняется на c единиц, изменится в том же направлении на c/n единиц;

– некоторые множества данных не имеют центральной тенденции, что часто вводит в заблуждение при вычислении только одной меры центральной тенденции. Особенно это справедливо для групп, имеющих более чем одну моду;

– когда считают, что группа данных является выборкой из большой симметричной группы, среднее выборки, вероятно, ближе к центру большой группы, чем медиана и мода.

Все средние характеристики дают общую характеристику ряда результатов измерений. На практике нас часто интересует, как сильно каждый результат отклоняется от среднего значения. Однако легко можно представить, что две группы результатов измерений имеют одинаковые средние, но различные значения измерений. Например, для ряда 3, 6, 3 – среднее значение = 4; для ряда 5, 2, 5 – также среднее значение = 4, несмотря на существенное различие этих рядов.

Поэтому средние характеристики всегда необходимо дополнять показателями вариации, или колеблемости.

К характеристикам вариации , или колеблемости , результатов измерений относят размах варьирования, дисперсию, среднее квадратическое отклонение, коэффициент вариации, стандартную ошибку средней арифметической.

Самой простой характеристикой вариации является размах варьирования . Его определяют как разность между наибольшим и наименьшим результатами измерений. Однако он улавливает только крайние отклонения, но не отражает отклонений всех результатов.

Чтобы дать обобщающую характеристику, можно вычислить отклонения от среднего результата. Например, для ряда 3, 6, 3 значения будут следующими: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Сумма этих отклонений (– 1) + 2 + (– 1) всегда равна 0. Чтобы избежать этого, значения каждого отклонения возводят в квадрат: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Значение делает отклонения от средней более явственными: малые отклонения становятся еще меньше (0,5 2 =0,25), а большие – еще больше (5 2 = 25). Получившуюся сумму называют суммой квадратов отклонений . Разделив эту сумму на число измерений, получают средний квадрат отклонений, или дисперсию . Она обозначается s 2 и вычисляется по формуле:

.

Если число измерений не более 30, т.е. n ≤ 30, используется формула:

.

Величина n – 1 = k называется числом степеней свободы , под которым подразумевается число свободно варьирующих членов совокупности. Установлено, что при вычислении показателей вариации один член эмпирической совокупности всегда не имеет степени свободы.

Эти формулы применяются, когда результаты представлены неупорядоченной (обычной) выборкой.

Из характеристик колеблемости наиболее часто используется среднее квадратическое отклонение , которое определяется как положительное значение корня квадратного из значения дисперсии, т.е.:

.

Среднее квадратическое отклонение или стандартное отклонение характеризует степень отклонения результатов от среднего значения в абсолютных единицах и имеет те же единицы измерения, что и результаты измерения.

Однако для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения, эта характеристика не пригодна.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах. Вычисляется он по формуле:

.

В спортивной практике колеблемость результатов измерений в зависимости от величины коэффициента вариации считают небольшой
(0 – 10 %), средней (11 – 20 %) и большой (V > 20 %).

Коэффициент вариации имеет большое значение в статистической обработке результатов измерений, т. к., будучи величиной относительной (измеряется в процентах), позволяет сравнивать между собой колеблемость результатов измерений, имеющих различные единицы измерения. Коэффициент вариации можно использовать лишь в том случае, если измерения выполнены в шкале отношений.

2.4.2. Анализ статистических данных в MS Excel. Инструменты анализа: описательная статистика, корреляция.

В состав электронных таблиц Microsoft Excel входит так называемый пакет анализа – набор инструментов, предназначенный для решения сложных статистических задач. Данный пакет производит анализ статистических данных с помощью макрофункций и позволяет, выполнив одно действие, получить на выходе большое количество результатов. В пакете анализа, имеющемся в Excel, среди прочих инструментов анализа имеется разделы «Описательная статистика» и «Корреляция».

Инструмент «Описательная статистика» позволяет нам получить значительный перечень рассчитанных статистических характеристик для большого количества числовых рядов. С помощью инструмента «Корреляция» мы получаем корреляционную матрицу, содержащую все возможные парные коэффициенты корреляции. Для k рядов будет получено k (k – 1)/2 коэффициентов корреляции.

Пакет анализа вызывается с помощью пункта меню Сервис – Анализ данных… Если этот пункт меню отсутствует, значит, пакет анализа не установлен. Для его установки надо вызвать пункт меню Сервис – Надстройки… и включить надстройку «Пакет анализа», ОК (см. рисунок 1).

Рисунок 1. Диалоговое окно включения/выключения надстроек

После включения надстройки «Пакет анализа» будет доступен пункт меню Сервис – Анализ данных… При его выборе появляется следующее диалоговое окно (рисунок 2).

Рисунок 2. Диалоговое окно выбора инструмента для анализа данных

После выбора инструмента «Описательная статистика» и нажатия ОК появится еще одно диалоговое окно (рисунок 3), требующее ввода входных данных и места вывода результатов. Здесь достаточно в поле «Входной интервал» ввести диапазон ячеек, содержащих исходные данные. Можно указать диапазон с заголовками столбцов, в этом случае потребуется включить флажок «Метки в первой строке». Для указания выходного интервала достаточно указать только левую верхнюю ячейку диапазона. Результаты вычисления автоматически займут требуемое количество строк и столбцов в таблице.

Рисунок 3. Диалоговое окно инструмента «Описательная статистика»

Рассмотрим работу инструмента анализа «Описательная статистика» на следующем примере. В процессе обследования группы школьников (n = 21) измерялись следующие показатели: рост, масса тела, динамометрия правой и левой руки, жизненная емкость легких, проба Штанге и проба Генчи. Результаты были занесены в таблицу (рисунок 4).

Для получения статистических характеристик воспользуемся пакетом анализа, инструментом «Описательная статистика». В поле «Входной интервал» занесем диапазон ячеек В1:Н22. Так как выделенный входной интервал содержит заголовки столбцов, включаем флажок «Метки в первой строке». Для удобства работы в качестве места выхода результата выбираем «Новый рабочий лист». В качестве выводимых данных отметим флажками «Итоговая статистика» и «Уровень надежности: 95 %». Последний флажок позволит вывести параметры доверительного интервала с доверительной вероятностью 0,95. Полученный результат после небольшого форматирования будет выглядеть так, как показано на рисунке 5.

Рисунок 4. Результаты обследования группы школьников

Рисунок 5. Результат работы инструмента «Описательная статистика»

После выбора инструмента «Корреляция» и нажатия ОК в диалоговом окне «Анализ данных» (рисунки 2, 6) появится еще одно диалоговое окно (рисунок 7), требующее ввода входных данных и места вывода результатов. Здесь достаточно в поле «Входной интервал» ввести диапазон ячеек, содержащих исходные данные. Можно указать диапазон с заголовками столбцов, в этом случае потребуется включить флажок «Метки в первой строке». Для указания выходного интервала достаточо указать только левую верхнюю ячейку диапазона. Результаты вычисления автоматически займут требуемое количество строк и столбцов в таблице.

Рисунок 6. Диалоговое окно выбора инструмента для анализа данных

Рисунок 7. Диалоговое окно инструмента «Корреляция»

Рассмотрим работу инструмента анализа «Корреляция» на примере, представленном на рисунке 4.

Для получения корреляционной матрицы воспользуемся пакетом анализа, инструментом «Корреляция». В поле «Входной интервал» занесем диапазон ячеек В1:Н22. Так как выделенный входной интервал содержит заголовки столбцов, включаем флажок «Метки в первой строке». Для удобства работы в качестве места выхода результата выбираем «Новый рабочий лист». Полученный результат после небольшого форматирования будет выглядеть так, как показано на рисунке 8.

Рисунок 8. Корреляционная матрица

Таким образом, путем выполнения несложных операций мы получаем большое количество результатов вычислений. Стоит отметить, что хотя информационные технологии открывают перед исследователем возможности получения огромного количества информации для анализа, отбор наиболее информативных результатов, окончательная интерпретация и формулировка выводов – работа самого исследователя.

Основные понятия корреляционного анализа экспериментальных данных. Оценка коэффициента корреляции по экспериментальным данным.

В спортивных исследованиях между изучаемыми показателями часто обнаруживается взаимосвязь. Вид ее бывает различным. Например, определение ускорения по известным данным скорости, второй закон Ньютона и другие характеризуют так называемую функциональную зависимость, или взаимосвязь, при которой каждому значению одного показателя соответствует строго определенное значение другого.

К другому виду взаимосвязи относят, например, зависимость веса от длины тела. Одному значению длины тела может соответствовать несколько значений веса и наоборот. В таких случаях, когда одному значению одного показателя соответствует несколько значений другого, взаимосвязь называют статистической .

Изучению статистической взаимосвязи между различными показателями в спортивных исследованиях уделяют большое внимание, поскольку это позволяет вскрыть некоторые закономерности и в дальнейшем описать их как словесно, так и математически с целью использования в практической работе тренера и педагога.

Среди статистических взаимосвязей наиболее важны корреляционные . Корреляция – это статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания (среднего значения) другой. Например, толкание ядра 3 кг и 5 кг. Улучшение результатов толкания ядра 3 кг вызывает улучшение (в среднем) результата в толкании ядра весом 5 кг.

Статистический метод, который используется для исследования взаимосвязей, называется корреляционным анализом . Основной задачей его является определение формы, тесноты и направленности взаимосвязи изучаемых показателей. Корреляционный анализ позволяет исследовать только статистическую взаимосвязь. Он широко используется в теории тестов для оценки их надежности и информативности. Различные шкалы измерений требуют разных вариантов корреляционного анализа.

Величина коэффициента взаимосвязи рассчитывается с учетом шкалы, использованной для измерений.

Для оценки взаимосвязи, когда измерения производят в шкале отношений или интервалов и форма взаимосвязи линейная, используется коэффициент корреляции Бравэ-Пирсона (коэффициенты корреляции для других шкал измерения в данном пособии не рассматриваются). Обозначается он латинской буквой – r. Вычисление значения r чаще всего производят по формуле:

,

где и – средние арифметические значения показателей x и y, и – средние квадратические отклонения, n – число измерений (испытуемых).

В некоторых случаях тесноту взаимосвязи определяют на основании коэффициента детерминации D, который вычисляется по формуле:

.

Этот коэффициент определяет часть общей вариации одного показателя, которая объясняется вариацией другого показателя. Например, коэффициент корреляции r = –0,677 (между результатами в беге на 30 м с ходу и тройном прыжке с места). Коэффициент детерминации равен:

Следовательно, 45,8 % рассеяния спортивного результата в тройном прыжке объясняется изменением результатов в беге на 30 м. Иными словами, на оба исследуемых признака действуют общие факторы, вызывающие варьирование этих признаков, и доля общих факторов составляет 45,8%. Остальные 100% – 45,8% = 54,2% приходятся на долю факторов, действующих на исследуемые признаки избирательно.

Оценить статистическую достоверность коэффициента корреляции – это значит определить, существует или нет линейная корреляционная связь между генеральными совокупностями или, что то же, установить, существенно или несущественно отличается от нуля коэффициент корреляции между выборками. Эта задача может быть решена с помощью таблиц критических точек распределения коэффициента корреляции в следующем порядке:

1. Выдвигаются статистические гипотезы. Гипотеза Н 0 предполагает отсутствие статистически значимой взаимосвязи между исследуемыми показателями (r ген =0). Гипотеза Н 1 предполагает, что существует статистически достоверная взаимосвязь между показателями (r ген >0).

2. Рассчитывается наблюдаемое значение коэффициента корреляции r набл .

3. Находится по таблице критическое значение коэффициента корреляции r крит в зависимости от объема выборки n , уровня значимости a и вида критической области (односторонняя или двусторонняя).

3. Сравнивается r набл и r крит .

Если r набл < r крит – статистически недостоверным (незначимым). Принимается гипотеза Н 0 Если r набл r крит , коэффициент корреляции считается статистически достоверным (значимым). Принимается гипотеза Н 1 .

По всему миру интерес к статистике возрастает. В наше время это внимание более обострено в связи с принятием ряда экономических реформ, затрагивающих интересы многих граждан.

Общая теория статистики есть одной из дисциплин, которая формирует специалистов высокого ранга, а именно финансистов и менеджеров. Статистика тесно повязана с экономическими и финансовыми дисциплинами, с маркетингом, менеджментом, обеспечивающими современную фундаментальную подготовку специалистов.

После изучения курса о «Статистике» должны усвоить следующие этапы:

  • основные этапы статистического исследования, их содержание;
  • знание основных формул и зависимость, которые используются при анализе статистических данных, умение анализировать и находить зависимости в явлениях, которые изучаются;
  • иметь представление о порядке проведения сводок и группировок статистических данных; методы сбора и обработки первичной статистической информации для проведения качественного экономического анализа; уметь проверять достоверность первичных данных в формах статистической отчетности;
  • вырабатывать практические навыки для проведения статистического исследования;
  • знать методы вычисления основных статистических показателей.

Определение

Статистика – это наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных явлениях, происходящих в природе и обществе.

В повседневной жизни мы часто слышим такое сочетания, как статистика заболеваний, статистика об авариях, статистика о разводов, статистика о народонаселении, и др.

Основной задачей статистики есть надлежащая обработка информации. Несомненно, у статистики имеется много других задач: получение и хранение информации, предоставление различных прогнозов, их оценка и достоверность. Но ни одна из этих целей не достигнуть без обработки данных. Поэтому, первое, на что стоит обратить внимание - это статистические методы обработки информации. Для этого существует большое количество терминов, принятых в статистике.

Определение

Математическая статистика - раздел в математике, в котором идется про методы и правила обработки и анализа статистических данных.

Исторические данные

Начало науки под названием «Математическая статистика» положенно знаменитым немецким математиком Карлом Фридрихом Гауссом (1777-1855), который на основании теории вероятности смог исследовать и обосновать метод наименьших квадратов, который создал в 1795 году и применив его для обработки астрономических данных. С помощью его имени довольно часто называют одно из известных распределений вероятностей, которое имеет название нормальное, а в теории случайных процессов основным объектом изучения есть гауссовские процессы.

В XIX в. – ХХ в. весомое вложение в математическую статистику внес английский ученый К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962). А именно, Пирсон разработал критерий о «хи-квадрат» проверки статистических гипотез, а Фишер – дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-х годах ХХ века поляк Ежи Нейман (1894-1977) и англичанин Э.Пирсон вывели обоюдную теорию проверки статистических гипотез, а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В.Смирнов (1900-1966) положили основы непараметрической статистики.

В сороковых годах ХХ в. Математик из Румынии А. Вальд (1902-1950) основал теорию последовательного статистического анализа.

Математическая статистика не перестает развиваться и в настоящее время.

Любое статистическое исследование можно разделить на три этапа: статистическое наблюдение , сводка и группировка материалов, полученных в результате наблюдения.

Статистическое наблюдение

Статистическое наблюдение различают по способам и видам проведения. Приведем их классификацию:

  1. За степенью охвата единиц исследуемой совокупности:
    1. Сплошное наблюдение, тогда когда охватывают все единицы совокупности (например, текущая отчетность предприятии, перепись населения).
    2. Частичное (не сплошное) наблюдение  обследованием охватывает определенная часть совокупности, которая изучается.
  2. Статистическое наблюдение в зависимости от времени может быть непрерывным, периодическим и единовременным.
    1. Непрерывное наблюдение – это такое, которое проходит непрерывно, по мере возникновения явлений, примером есть учет выпуска продукции на предприятии;
    2. Периодическое наблюдение – это наблюдение которое происходит через некоторые промежутки времени, примером является сессия в университете.
    3. Единовременное наблюдение – это наблюдение проходящее по мере необходимости, примером является перепись населения.
  3. В зависимости от источника собираемых данных различают:
    1. Непосредственное наблюдение, наблюдение которое проводится лично регистратором - снятие товарных остатков, изучение и замер норм времени;
    2. Документальное наблюдение, тогда, когда используют документы различного рода;
    3. Наблюдение базируется на опросе интересующихся лиц и получение данных в форме ответов.
  4. За способом организации различают такие наблюдения:
    1. Те, которые заключаются в обработке отчетных данных, отчетность, наиболее распространена в практике работы.
    2. Экспедиционный способ - к каждой единице совокупности прикрепляется специальное лицо, которое фиксирует сведения, являющиеся необходимыми;
    3. Заполнение специальных бланков – Саморегистрация;
    4. Способ Анкетирования - рассылка анкет и их дальнейшая обработка.

Самой распространенной формой статистического наблюдения есть представление отчетности. Виды статистической отчетности можно разделить на типовую и специализированную; за периодичностью различают недельную, месячную, квартальную и годовую отчетности.

Классификация ошибок

Определение

Ошибка – это расхождение между результатами наблюдений и истинными значениями величины, что исследуется.

Классификация ошибок:

  1. За характером ошибки различают:
    1. случайные ошибки, те которые вызываются любыми причинами. Случайные ошибки не особо влияют на весь результат;
    2. систематические ошибки, искажают явление только в одну из сторон более опасные и, иногда, вызывают действие систематического фактора.
  2. За стадией возникновения:
    1. ошибки при регистрации;
    2. ошибки во время подготовки данных к обработке;
    3. ошибки при обработке.
  3. За причинам возникновения:
    1. свойственные только выборочному методу и связанные с неправильным выбором части совокупности ошибки репрезентативности;
    2. непреднамеренные ошибки, совершаются случайно тоесть не являются целью исказить результат наблюдения;
    3. преднамеренные ошибки случаются при результате преднамеренного искажения фактов. Все специальные ошибки являются систематическими.

ОГЛАВЛЕНИЕ

Введение. 2

Понятие статистики. 2

История математической статистики. 3

Простейшие статистические характеристики. 5

Статистические исследования. 8

1. СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ 9

2. РАЗМАХ 10

4. МЕДИАНА 11

5. СОВМЕСТНОЕ ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК 11

Перспективы и вывод. 11

Список литературы. 12
Введение.

В октябре на перемене перед уроком наш учитель математики Марианна Рудольфовна проверяла самостоятельные работы у 7 класса. Увидев, о чем они пишут, я не поняла ни слова, но спросила у Марианны Рудольфовны, что означают незнакомые мне слова – размах, мода, медиана, среднее. Получив ответ, я ничего не поняла. Под конец 2 четверти Марианна Рудольфовна предложила кому-нибудь из нашего класса сделать реферат на эту самую тему. Мне показалась эта работа очень интересной, и я согласилась.

В ходе работы рассматривались такие вопросы

Что такое математическая статистика?

В чем значение статистики для обычного человека?

Где применяются полученные знания?

Почему человек не может обойтись без математической статистики?

Понятие статистики.

СТАТИСТИКА – это наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных явлениях, происходящих в природе и обществе.

В средствах массовой информации часто встречаются такие фразы, как статистика аварий, статистика народонаселения, статистика заболеваний, статистика разводов и др.

Одна из основных задач статистики состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Ни одна из этих целей не достижима без обработки данных. Поэтому, первое, чем стоит заняться - это статистическими методами обработки информации. Для этого есть много терминов, принятых в статистике.

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - раздел математики, посвященный методам и правилам обработки и анализа статистических данных

История математической статистики.

Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов, созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей – нормальное, а в теории случайных процессов основной объект изучения – гауссовские процессы.

В конце XIX в. – начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962). В частности, Пирсон разработал критерий «хи-квадрат» проверки статистических гипотез, а Фишер – дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ века поляк Ежи Нейман (1894-1977) и англичанин Э.Пирсон развили общую теорию проверки статистических гипотез,

а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В.Смирнов (1900-1966) заложили основы непараметрической статистики.

В сороковые годы ХХ в. румынский математик А. Вальд (1902-1950) построил теорию последовательного статистического анализа.

Математическая статистика бурно развивается и в настоящее время.

^ Простейшие статистические характеристики.

В повседневной жизни мы, не догадываясь, используем такие понятия как медиана, мода, размах и среднее арифметическое. Даже когда мы ходим в магазин или делаем уборку.

^ Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Среднее арифметическое является важной характеристикой ряда чисел, но иногда полезно рассматривать и другие средние.

Модой называют число ряда, которое встречается в этом ряду наиболее часто. Можно сказать, что данное число самое «модное» в этом ряду. Такой показатель, как мода, используется не только для числовых данных. Если, например, опросить большую группу учеников, какой школьный предмет им нравится больше всего, то модой этого ряда ответов окажется тот предмет, который будут называть чаще остальных.

Мода – показатель, который широко используется в статистике. Одним из наиболее частых использований моды является изучение спроса. Например, при решении вопросов, в пачки какого веса фасовать масло, какие открывать авиарейсы и т. п., предварительно изучается спрос и выявляется мода - наиболее часто встречающийся заказ.

Заметим, что в рядах, рассматриваемых в реальных статистических исследованиях, иногда выделяют больше одной моды. Когда в ряду много данных, то интересными бывают все те значения, которые встречаются гораздо чаще других. Их статистики тоже называют модой.

Однако нахождение среднего арифметического или моды далеко не всегда позволяет делать надежные выводы на основе статистических данных. Если есть ряд данных, то, помимо средних значений, надо еще указать, насколько используемые данные различаются между собой.

Одним из статистических показателей различия или разброса данных является размах.

Размах - это разность между наибольшим и наименьшим значениями ряда данных.

Еще одной важной статистической характеристикой ряда данных является его медиана. Обычно медиану ищут в случае, когда числа в ряду являются какими-либо показателями и надо найти, например, человека, показавшего средний результат, фирму со средней годовой прибылью, авиакомпанию, предлагающую средние цены на билеты, и т. д.

Медианой ряда, состоящего из нечетного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить. Медианой ряда, состоящего из четного количества чисел, называется среднее арифметическое двух стоящих посередине чисел этого ряда.

Например:

1. В школах г. Перми каждый год проходит ЕРТ за 4 класс и в 2010 году были получены следующие средние баллы:

Математика

Русский язык

Гимназия № 4

Моя мама работает на пермском пороховом заводе бухгалтером. Зарплата сотрудников этого предприятия колеблется в размерах от 12000 до18000. разность составляет 6000. Это называется размах

Несколько лет назад мы с родителями отдыхали на юге в Анапе. Я обратила внимание, что на номерах машин чаще всего встречается №23 – номер региона. Это называется мода.

На выполнение домашнего задания я тратила в течение недели такое время – 60 мин в понедельник, во вторник 103 мин, в среду 58, в четверг 76 , а в пятницу 89 мин. Записав эти числа от меньшего к большему, посередине стоит число 76 – это называется медиана.

Статистические исследования.

«Статистика знает всё»,- утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать – на эти вопросы отвечает статистика (от итальянского stato – государство, латинского status – состояние).

^ 1. СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ
Я вычислила средние затраты на электроэнергию в нашей семье в течение 2010 года:

Расход, кВт/ч

(189 + 155*2 + 106*2 + 102 + 112*2 + 138 + 160 + 156 + 149) : 12 = 136 – среднее арифметическое

^ Когда нужно и не нужно среднее арифметическое?

Имеет смысл вычислять средние траты в семье на продукты, среднюю урожайность картофеля на огороде, средние расходы на продукты, чтобы понять, как поступать в следующий раз, чтобы не было большого перерасхода, среднюю оценку за четверть – по ней поставят оценку за четверть.

Нет смысла вычислять среднюю зарплату моей мамы и Абрамовича, среднюю температуру здорового и больного человека, средний размер обуви у меня и у моего брата.
2. РАЗМАХ
Рост девочек нашего класса самый разный:

151 см, 160 см, 163 см, 162 см, 145 см, 130 см, 131 см, 161 см

Размах составляет 163 – 130 = 33 см. Размах определяет разницу в росте.

^ Когда нужен и не нужен размах?

Размах ряда находят тогда, когда хотят определить, как велик разброс данных в ряду. Например, в течение суток отмечали каждый час температуру воздуха в городе. Для полученного ряда данных полезно не только вычислять среднее арифметическое, показывающее, какова среднесуточная температура, но и найти размах ряда, характеризующий колебание температуры воздуха в течение этих суток. Для температуры на Меркурии, например, размах равен 350 + 150=500 С. Конечно, такого перепада температур человек выдержать не может.

3. МОДА
Я выписала свои оценки за декабрь по математике:

4,5,5,4,4,4,4,5,5,4,5,5,4,5,5,5,5,5,5. Оказалось, что я получила:

«5» - 7, «4» - 5, «3» - 0, «2» - 0

Мода равна 5.

Но мода бывает не одна, например, по природоведению в октябре у меня были такие оценки – 4,4,5,4,4,3,5,5,5. Мод здесь две – 4 и 5

Когда нужна мода?

Мода важна для производителей при определении самого популярного размера одежды, обуви, размеров бутылки сока, пачки чипсов, популярного фасона одежды

4. МЕДИАНА
При анализе результатов, показанных участниками забега учеников класса на 100 метров знание медианы позволяет учителю физкультуры выделить для участия в соревнованиях группу ребят, показавших результат выше срединного.

^ Когда нужна и не нужна медиана?

Медиана чаще применяется с другими статистическими характеристиками, но по неё одной можно отбирать результаты, выше или ниже медианы

^ 5. СОВМЕСТНОЕ ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК
В нашем классе за последнюю проверочную работу по математике по теме «Измерение углов и их виды» были получены следующие оценки: «5» - 10, «4» - 5, «3» - 7, «2» - 1.

Среднее арифметическое - 4.3, размах - 3, мода - 5, медиана – 4.

^ Перспективы и вывод.

Статистические характеристики позволяют изучать числовые ряды. Только все вместе они могут дать объективную оценку ситуации

Нельзя правильно организовывать нашу жизнь, не зная законов математики. Она позволяет изучать, узнавать, исправлять.

Статистика создает фундамент точных и бесспорных фактов, который необходим для теоретических и практических целей.

Математики изобрели статистику потому, что она была нужна обществу

Думаю, что знания, полученные при работе над данной темой, пригодятся мне в дальнейшей учебе и в жизни.

Изучая литературу, я узнала, что есть еще такие характеристики, как среднее квадратичное отклонение, дисперсия и другие.

Однако моих знаний недостаточно, чтобы в них разобраться. О них – в будущем.

^ Список литературы.
Учебное пособие для учащихся 7-9 классов общеобразовательных учреждений «Алгебра. Элементы статистики и теории вероятностей». Ю.Н.Макарычев, Н.Г.Миндюк, под редакцией С.А.Теляковского; Москва. Просвещение. 2005 г.

Статьи из приложения к газете «Первое сентября. Математика».

Энциклопедический СЛОВАРЬ ЮНОГО МАТЕМАТИКА

http://statist.my1.ru/

http://art.ioso.ru/seminar/2009/projects11/rezim/stat1.html

Одна из основных задач статистики состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Но ни одна из этих целей не достижима без обработки данных. Поэтому, сперва необходимо выделить основные характеристики статистических данных.

Электронные таблицы Excel имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встроены в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительную подпрограмму, называемую пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа.

Рассмотрим основные характеристики выборочных данных.

Среднее значение.

С помощью среднего значения вычисляют выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. В Excel среднее значение вычисляется так: =СУММ(F4:F60)/СЧЁТ(F4:F60). Также в Excel существует функция для его вычисления: СРЗНАЧ. Аргументом функции является набор чисел, как правило, задаваемый в виде интервала ячеек, например: =СРЗНАЧ (А3:А201).

Выборочная дисперсия и выборочное среднее квадратическое отклонение.

Выборочной дисперсией значений случайной величины Х называется среднее арифметическое квадратов отклонений наблюдаемых значений этой величины от их среднего арифметического:

Дисперсия характеризует отклонение от средней в квадратных единицах измерения признака, поэтому используют такой показатель, как среднее квадратичное отклонение, который измеряется в тех же единицах, что и изучаемый признак.

Выборочное среднее квадратичное отклонение определяется формулой:

Excel имеются функции, отдельно вычисляющие выборочную дисперсию стандартное отклонение в и генеральные дисперсию D г и стандартное отклонение г. Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной. В зависимости от этого нужно использовать для расчета D г и г, и в .

Вычисление выборочной дисперсии и выборочного стандартного отклонения в производится с помощью функций: = СУММ((4: 60 ? 28)^2)/ (СЧЁТ(4: 60)) и = КОРЕНЬ(29).

В Excel имеются функции ДИСП (или VAR) и СТАНДОТКЛОН (или STDEV).

Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП (В1:В48).

Для вычисления генеральной дисперсии D г и генерального стандартного отклонения г имеются функции ДИСПР (или VARP) и СТАНДОТКЛОНП (или STDEVP), соответственно.

Аргументы этих функций такие же, как и для выборочной дисперсии.

Объем совокупности.

Объем совокупности выборочной или генеральной - это число элементов совокупности. Функция СЧЕТ (или COUNT) определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).

Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.

Мода и медиана.

Мода (?) - это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА (или MODE). Ее аргументом является интервал ячеек с данными. Мода не вычисляется при исследовании НСВ.

Медиана (?) - это значение признака, которое разделяет совокупность на две равные по числу элементов части. Для вариационного ряда с нечётным числом членов медиана равна серединному варианту, а для ряда с чётным числом членов - полусумме двух серединных вариантов. Она вычисляется функцией МЕДИАНА (или MEDIAN). Ее аргументом является интервал ячеек.

Размах варьирования. Наибольшее и наименьшее значения.

Размах варьирования R - это разность между наибольшим x max и наименьшим xmin значениями признака совокупности (генеральной или выборочной): R =x max-x min.

Для нахождения наибольшего значения x max имеется функция МАКС (или MAX), а для наименьшего x min - функция МИН (или MIN). Их аргументом является интервал ячеек. Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу: =МАКС (А1:А100)-МИН (А1:А100).

Коэффициент вариации. Вычисляется как процентное соотношение выборочного среднего квадратичного отклонения к средней арифметической.

Если коэффициент вариации высок (более 35%), то выборочная совокупность считается неоднородной. Следовательно, использование среднего для её характеристики является неверным. В этом случае используют моду или медиану.

Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцесс Е .

Для нормального распределения А =0 и Е =0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А >0, то большая часть данных имеет значения, превышающие среднее; если А <0, то большая часть данных имеет значения, меньшие среднего. Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Эксцесс оценивает «крутость», т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е >0, то максимум экспериментального распределения выше нормального; если Е <0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100). [см. 5]

Получаем следующие вычисления (рисунок 14).

Рисунок 14 Вычисление основных характеристик

Получили следующие значения (рисунок 15).


Рисунок 15 Значения основных характеристик

Так как значение коэффициента вариации значительно превышает 35%, выборка является неоднородной и в качестве среднего значения используется медиана.

Статистика - одна из древнейших отраслей прикладной математики, которая широко использует теоретическую базу многих арифметических определений для осуществления практической деятельности человека. Ещё в древних государствах возникла необходимость строгого учета дохода граждан по группам, для проведения эффективного процесса налогообложения. Статистические исследования имеют громадное значение для экономического развития общества, и не только. Поэтому, в данном видеоуроке мы рассмотрим основные определения статистических характеристик.

Предположим, нам необходимо изучить статистику выполнения тестов учениками седьмого класса. Для начала нам необходимо создать массив информации, с которым можно работать. Информацией, в данном случае, будут являться цифры, определяющие количество выполненных тестов каждым из учеников. Рассмотрим два класса, содержащие по 15 школьников каждый. Общее задание включало 10 упражнений. Результаты получились следующими:

7А: 4, 10, 6, 4, 7, 8, 2, 10, 8, 5, 7, 9, 10, 6, 3;

7Б: 7, 5, 9, 7, 8, 10, 7, 1, 7, 6, 5, 9, 8, 10, 7.

Мы получили, в математической интерпретации, два множества чисел, состоящие из 15 элементов каждое. Этот информационный массив, сам по себе, мало чем может помочь в оценивании эффективности выполнения заданий. Поэтому его нужно статистически преобразовать. Для этого введем основные понятия статистики. Ряд чисел, полученных в результате исследования, называется выборкой. Каждое число (количество выполненных упражнений) - это варианта выборки. А количество всех чисел (в данном случае, это 30 - сумма всех учеников в обоих классах) является объемом выборки.

Одной из главных статистических характеристик является среднее арифметическое. Это значение определяется как частное, полученное в результате деления суммы значений вариант выборки на её объем. В нашем случае необходимо сложить все полученные значения чисел и поделить их на 15 (если мы вычисляем среднее арифметическое для какого-либо одного класса), либо же на 30 (если мы вычисляем общее среднее арифметическое). В представляемом примере, сумма всех количеств выполненных заданий для класса 7А составит 99. Поделив на 15, получаем 6,6 - это среднее арифметическое выполненных заданий для данной группы учеников.

Работать с хаотичным набором чисел не очень удобно, поэтому очень часто информационный массив приводят к упорядоченному набору данных. Создадим вариационный ряд для 7Б класса, использовав метод постепенного возрастания, располагая числа от меньшего к большему:

1, 5, 5, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10.

Количество появлений какого-либо одного значения в выборке данных называется частотой варианты выборки. Например, частота варианты «7» в вышеуказанном вариационном ряду легко определяется, и равна она пяти. Для удобства отображения упорядоченный ряд преобразуется в таблицу, отображающую зависимость между стандартным рядом значений вариант, и частотой встречаемости (количеством учеников, выполнивших одинаковое количество задач).

В 7А классе наименьшей вариантой выборки является значение «2», а наибольшей - «10». Интервал между 2 и 10 называется размахом вариационного ряда. Для 7Б класса размах ряда составляет от 1 до 10. Наибольшая, по частоте встречаемости, варианта называется модой выборки - для 7А это число 7, встречающееся 5 раз.