Как отмечено в предыдущем разделе, изучение классических алгоритмов во многих случаях может быть проведено с помощью асимптотических методов математической статистики, в частности, с помощью ЦПТ и методов наследования сходимости . Отрыв классической математической статистики от нужд прикладных исследований проявился, в частности, в том, что в распространенных монографиях недостает математического аппарата, необходимого, в частности, для изучения двухвыборочных статистик. Суть в том, что переходить к пределу приходится не по одному параметру, а по двум – объемам двух выборок. Пришлось разработать соответствующую теорию – теорию наследования сходимости, изложенную в нашей монографии .

Однако применять результаты подобного изучения придется при конечных объемах выборок. Возникает целый букет проблем, связанных с таким переходом. Часть из них обсуждалась в в связи с изучением свойств статистик, построенных по выборкам из конкретных распределений.

Однако при обсуждении влияния отклонений от исходных предположений на свойства статистических процедур возникают дополнительные проблемы. Какие отклонения считать типичными? Ориентироваться ли на наиболее "вредные" отклонения, в наибольшей степени искажающие свойства алгоритмов, или же сосредоточить внимание на "типичных" отклонениях?

При первом подходе получаем гарантированный результат, но "цена" этого результата может быть излишне высокой. В качестве примера укажем на универсальное неравенство Берри-Эссеена для погрешности в ЦПТ . Совершенно справедливо подчеркивает А.А. Боровков , что "скорость сходимости в реальных задачах, как правило, оказывается лучше."

При втором подходе возникает вопрос, какие отклонения считать "типичными". Попытаться ответить на этот вопрос можно, анализируя большие массивы реальных данных. Вполне естественно, что ответы различных исследовательских групп будут различаться, как это видно, например, по результатам, приведенным в статье .

Одна из ложных идей - использование при анализе возможных отклонений только какого-либо конкретного параметрического семейства – распределений Вейбулла-Гнеденко, трехпараметрического семейства гамма - распределений и др. Еще в 1927 г. акад. АН СССР С.Н. Бернштейн обсуждал методологическую ошибку, состоящую в сведении всех эмпирических распределений к четырехпараметрическому семейству Пирсона . Однако и до сих пор параметрические методы статистики весьма популярны, особенно среди прикладников, и вина за это заблуждение лежит прежде всего на преподавателях статистических методов (см. ниже, а также статью ).

15. Выбор одного из многих критериев для проверки конкретной гипотезы

Во многих случаях для решения конкретной практической задачи разработано много методов, и специалист по математическим методам исследования стоит перед проблемой: какой из них предложить прикладнику для анализа конкретных данных?

В качестве примера рассмотрим задачу проверки однородности двух независимых выборок. Как известно , для ее решения можно предложить массу критериев: Стьюдента, Крамера-Уэлча, Лорда, хи - квадрат, Вилкоксона (Манна-Уитни), Ван – дер - Вардена, Сэвиджа, Н.В.Смирнова, типа омега-квадрат (Лемана-Розенблатта), Г.В.Мартынова и др. Какой выбрать?

Естественным образом приходит в голову идея "голосования": провести проверку по многим критериям, а затем принять решение "по большинству голосов". С точки зрения статистической теории такая процедура приводит попросту к построению еще одного критерия, который априори ничем не лучше прежних, но более труден для изучения. С другой стороны, если совпадают решения по всем рассмотренным статистическим критериям, исходящим из различных принципов, то в соответствии с концепцией устойчивости это повышает доверие к полученному общему решению.

Распространено, особенно среди математиков, ложное и вредное мнение о необходимости поиска оптимальных методов, решений и т.д. Дело в том, что оптимальность обычно исчезает при отклонении от исходных предпосылок. Так, среднее арифметическое в качестве оценки математического ожидания является оптимальной только тогда, когда исходное распределение - нормальное , в то время как состоятельной оценкой - всегда, лишь бы математическое ожидание существовало. С другой стороны, для любого произвольно взятого метода оценивания или проверки гипотез обычно можно так сформулировать понятие оптимальности, чтобы рассматриваемый метод стал оптимальным – с этой специально выбранной точки зрения. Возьмем, например, выборочную медиану как оценку математического ожидания. Она, разумеется, оптимальна, хотя и в другом смысле, чем среднее арифметическое (оптимальное для нормального распределения). А именно, для распределения Лапласа выборочная медиана является оценкой максимального правдоподобия, а потому оптимальной (в смысле, уточненном в монографии ).

Критерии однородности были проанализированы в монографии . Естественных подходов к сравнению критериев несколько - на основе асимптотической относительной эффективности по Бахадуру, Ходжесу-Леману, Питмену. И выяснилось, что каждый критерий является оптимальным при соответствующей альтернативе или подходящем распределении на множестве альтернатив. При этом математические выкладки обычно используют альтернативу сдвига, сравнительно редко встречающуюся в практике анализа реальных статистических данных (в связи с критерием Вилкоксона эта альтернатива обсуждалась и критиковалась нами в ). Итог печален - блестящая математическая техника, продемонстрированная в , не позволяет дать рекомендации для выбора критерия проверки однородности при анализе реальных данных. Другими словами, с точки зрения работы прикладника, т.е. анализа конкретных данных, монография бесполезна. Блестящее владение математикой и огромное трудолюбие, продемонстрированные автором этой монографии, увы, ничего не принесли практике.

Конечно, каждый практически работающий статистик так или иначе решает для себя проблему выбора статистического критерия. На основе ряда методологических соображений мы остановили свой выбор на состоятельном против любой альтернативы критерии типа омега-квадрат (Лемана-Розенблатта). Однако остается чувство неудовлетворенности в связи с недостаточной обоснованностью этого выбора.

Диссертация

Поэтому одним из путей развития проверки статистических гипотез стал путь «эмпирического» построения критериев, когда конструируемая статистика критерия основана на определенном принципе, остроумной идее или здравом смысле, но оптимальность ее не гарантирована. Для того, чтобы оправдать применение подобных статистик при проверке гипотез против определенного класса альтернатив, чаще всего методом...

  • 1. Вспомогательные сведения
    • 1. 1. Сведения из теории С/- и V- статистик
    • 1. 2. Определение и вычисление бахадуровской эффективности
    • 1. 3. О больших уклонениях II- и V- статистик
  • 2. Критерии симметрии Барингхауза-Хенце
    • 2. 1. Введение
    • 2. 2. Статистика
    • 2. 3. Статистика
  • 3. Критерии экспоненциальности
    • 3. 1. Введение
    • 3. 2. Статистика Я
    • 3. 3. Статистика п
  • 4. Критерии нормальности
    • 4. 1. Введение
    • 4. 2. Статистика В^
    • 4. 3. Статистика В^п
    • 4. 4. Статистика В|)П
  • 5. Критерии согласия с законом Коши
    • 5. 1. Введение
    • 5. 2. Статистика
    • 5. 3. Статистика

Асимптотические свойства критериев симметрии и согласия, основанных на характеризациях (реферат, курсовая, диплом, контрольная)

В настоящей диссертации строятся и исследуются критерии согласия и симметрии, основанные на характеризационных свойствах распределений, а также вычисляется их асимптотическая относительная эффективность для ряда альтернатив.

Построение статистических критериев и изучение их асимптотических свойств является одной из важнейших задач математической статистики. При проверке простой гипотезы против простой альтернативы задача решается с помощью леммы Неймана-Пирсона, которая, как известно, дает оптимальный (наиболее мощный) критерий в классе всех критериев заданного уровня. Это критерий отношения правдоподобия.

Однако для более трудных и важных для практики задач проверки гипотез, связанных либо с проверкой сложных гипотез, либо с рассмотрением сложных альтернатив, равномерно наиболее мощные критерии существуют редко, а роль критерия отношения правдоподобия существенно меняется. Статистику отношения правдоподобия обычно не удается вычислить в явном виде, она теряет свойство оптимальности, а ее распределение неустойчиво к изменениям статистической модели. Более того, статистик часто вообще не может определить вид альтернативы, без чего построение параметрических критериев теряет смысл.

Поэтому одним из путей развития проверки статистических гипотез стал путь «эмпирического» построения критериев, когда конструируемая статистика критерия основана на определенном принципе, остроумной идее или здравом смысле, но оптимальность ее не гарантирована.

Типичными примерами таких статистик являются статистика знаков, статистика х2 Пирсона (1900), статистика Колмогорова (1933), измеряющая равномерное расстояние между эмпирической и истинной функцией распределения, ранговый коэффициент корреляции Кендалла (1938) или статистика Бикела-Розенблатта (1973), основанная на квадратичном риске ядерной оценки плотности . В настоящее время математическая статистика располагает многими десятками «эмпирических» статистик для проверки гипотез согласия, симметрии, однородности, случайности и независимости, и в литературе постоянно предлагаются все новые и новые статистики такого типа. Огромная литература посвящена изучению их точных и предельных распределений, оценкам скорости сходимости, большим уклонениям, асимптотическим разложениям и т. д.

Для того, чтобы оправдать применение подобных статистик при проверке гипотез против определенного класса альтернатив, чаще всего методом статистического моделирования вычисляют их мощность. Однако для любого состоятельного критерия мощность с ростом объема выборки стремится к единице, и потому не всегда информативна. Более глубокий анализ сравнительных свойств статистик может быть осуществлен на основе понятия асимптотической относительной эффективности (АОЭ). Различные подходы к вычислению АОЭ предлагались Э. Питменом, Дж. Ходжесом и Э. Леманом, Р. Бахадуром, Г. Черновым и В. Калленбергом в середине XX в., результаты развития теории АОЭ к середине 90-х годов подведены в монографии . Общепринято мнение, что синтез новых критериев должен сопровождаться не только анализом их свойств, но и вычислением АОЭ для того, чтобы оценить их качество и дать обосно ванные рекомендации по их использованию на практике.

В настоящей работе используется идея построения критериев на основе характеризации распределений свойством равнораспределенности. Ха-рактеризационная теория берет свое начало из работы Д. Пойа, опубликованной в 1923 г. Затем она развивалась в работах И. Марцинкевича, С. Н. Бернштейна, Э. Лукача, Ю. В. Линника, A.A. Зингера, Ж. Дармуа, В. П. Скитовича, С.Р. Pao, A.M. Кагана, Я. Галамбоша, С. Котца, Л. Б. Клебанова и многих других математиков. Литература по этому вопросу велика, и в настоящее время существует несколько монографий, посвященных характеризациям, например, , , , , , , .

Идея построения статистических критериев на основе характериза-ций свойством равнораспределенности принадлежит Ю. В. Линнику , . В конце обширной работы он писал: «. можно поставить вопрос о построении критериев согласия выборки со сложной гипотезой, основанных на одинаковой распределенности двух соответствующих статистик gi (xi> .хг) и д2{х, ¦¦¦хг) и на сведении, таким образом, вопроса к критерию однородности.»

Вернемся к классической теореме Пойа , чтобы объяснить на конкретном примере, как может действовать такой подход. В простейшем варианте эта теорема формулируется следующим образом.

Теорема Пойа. Пусть X и Y две независимые и одинаково распределенные центрированные с. в. Тогда с. в. (X + Y)//2 и X одинаково распределены в том и только том случае, когда закон распределения X нормальный.

Предположим, что мы имеем выборку из центрированных независимых наблюдений Xi, ., Хп и хотим проверить (сложную) нулевую гипотезу о принадлежности распределения этой выборки к нормальному закону со средним 0 и некоторой дисперсией. Построим по нашей выборке обычную эмпирическую функцию распределения (ф.р.) п

Fn (t) = п-^ВД

Gn (t) = п~2? ВД + Xj < iv^}, t <= R1. i, j=l

В силу теоремы Гливенко-Кантелли, справедливой и для V-статисти-ческих эмпирических ф.р. , при больших п функция Fn (t) равномерно сближается с ф.р. F (t) = Р (Х < t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Однако эта конструкция, основывающаяся на идее Ю. В. Линника, почти не получила развития, возможно, ввиду технических трудностей при построении и анализе получающихся критериев. Другая причина состоит, вероятно, в том, что характеризации распределений свойством равнораспределенности немногочисленны и редко встречаются.

Нам известны лишь немногие работы, посвященные в той или иной мере развитию идеи Ю. В. Линника. Это работы Барингхауза и Хенце и Мульере и Никитина , о которых будет сказано ниже. Имеются и работы, в которых критерии согласия для конкретных распределений также строятся на основе характеризаций, но не на основе равнораспределенности, например, , , , , , , , .

Наиболее часто в литературе встречается использование характериза-ции экспоненциального распределения различными вариантами свойства отсутствия памяти , , , , , , .

Следует отметить, что почти во всех этих работах (кроме разве лишь и ) АОЭ рассматриваемых критериев не вычисляется и не обсуждается. В настоящей диссертации мы не только исследуем асимптотические свойства известных и предлагаемых нами критериев, основанных на характеризациях, но и вычисляем их локальную точную (или приближенную) АОЭ по Бахадуру.

Дадим теперь определение понятию АОЭ. Пусть {Тп} и {1^} - две последовательности статистик, построенные по выборке Х,., Хп с распределением Рд, где в € 0 С Я1, и проверяется нулевая гипотеза Но: 9 € во С в против альтернативы А: в € ©-х = ©-6о. Пусть Мт (а, Р,0) — минимальный объем выборки Х[,., Хп, для которого последовательность {Тп} с заданным уровнем значимости, а > 0 достигает мощности /3 < 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Поскольку относительная эффективность как функция трех аргументов не поддается вычислению в явном виде даже для самых простых статистик, то принято рассматривать пределы:

Птет, у (а,/?, 0), Нтет, у (а,/3,0).

В первом случае получается АОЭ по Бахадуру, второй предел определяет АОЭ по Ходжесу-Леману, а третий приводит к определению АОЭ по Питмену. Поскольку в практических приложениях наиболее интересны именно случаи малых уровней значимости, высоких мощностей и близких альтернатив, то все три определения представляются обоснованными и естественными.

В данной работе для сравнения критериев мы будем пользоваться АОЭ по Бахадуру. Для этого есть несколько причин. Во-первых, питме-новская эффективность пригодна в основном для асимптотически нормальных статистик, и при этом условии совпадает с локальной баха-дуровской эффективностью , . Мы же рассматриваем не только асимптотически нормальные статистики, но и статистики квадратичного типа, для которых предельное распределение при нулевой гипотезе резко отличается от нормального, так что питменовская эффективность неприменима. Во-вторых, АОЭ по Ходжесу-Леману непригодна для исследования двусторонних критериев , , поскольку все они оказываются асимптотически оптимальными, а для односторонних критериев эта АОЭ обычно локально совпадает с бахадуровской АОЭ . В третьих, недавно был достигнут значительный прогресс в области больших уклонений для тестовых статистик, что является решающим при вычислении АОЭ по Бахадуру. Мы имеем в виду большие уклонения и— и V—статистик, описанные в недавних работах и .

Перейдем теперь к обзору содержания диссертации. Первая глава носит вспомогательный характер. В ней излагаются необходимые теоретические и технические сведения из теории 11-статистик, теории больших уклонений и теории асимптотической эффективности по Бахадуру.

Глава 2 посвящена построению и исследованию критериев для проверки гипотезы симметрии. Барингхауз и Хенце в предложили идею построения критериев симметрии, основанных на следующей элементарной характеризации.

Пусть X и У — н.о.р.с.в., имеющие непрерывную ф.р. Тогда |Х| и |тах (Х, У)| одинаково распределены тогда и только тогда, когда X и У симметрично распределены относительно нуля.

Эту характеризацию мы используем для построения новых критериев симметрии. Вспомним, что несколько классических критериев симметрии (см. , гл.4) основаны на характеризации симметрии еще более простым свойством равнораспределенности X и —X.

Вернемся к характеризации Барингхауза-Хенце. Пусть Х, ., Хп наблюдения, имеющие непрерывную ф.р. <7. Рассмотрим проверку гипотезы симметрии:

Н0: ОД = 1 — <3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в > 0- скошенную (skew) альтернативу , т. е. д (х-в) = 2f (x)F ($x), в > 0- лемановскую альтернативу , т. е. G (x-, 6) = F1+e (x), 6 > 0 и альтернативу загрязнения , т. е. G{x-6) = (1 — 6) F{x) + 6Fr+1(x), в > 0, г > 0, где F (x) и f (x) являются ф.р. и плотностью некоторого симметричного распределения.

В соответствии с указанной выше характеризацией строится эмпирическая ф.р., основанная на |Xj|,., Хп, п

Hn (t) = n~2 J2 Цтах (Х^Хк)<г}. На основе этих функций составляются статистики: лоо ):

Пусть X uY — неотрицательные и невырожденные н.о.р.с.в., имеющие дифференцируемую в нуле ф.р. F, и пусть 0 < а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Помимо построения самого критерия согласия и изучения его асимптотических свойств, представляют интерес вычисление АОЭ нового критерия и исследование ее зависимости от параметра а.

Второе обобщение этой характеризации принадлежит Дезу . Мы сформулируем его на основе более поздних работ , :

Пусть Xi, ., Хт, т ^ 2 — неотрицательные и невырожденные н.о.р. с.в., имеющие дифференцируемую в нуле ф.р. F. Тогда статистики Х и т minpfi, ., Хт) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Пусть Хх,., Хп — независимые наблюдения, имеющие ф.р. Основываясь на сформулированных выше характеризациях, мы можем проверить гипотезу экспоненциальности Но, которая состоит в том, что (7 есть ф.р. экспоненциального закона.Р, против альтернативы Н, состоящей в том, что С Ф? при слабых дополнительных условиях.

В соответствии с данными характеризациями строятся эмпирическая ф.р. п = пВД < О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Мы предлагаем основывать критерии для проверки экспоненциаль-ности на статистиках: пкп = - с&bdquo-(*)] аоп{1).

В качестве альтернатив мы выбираем стандартные альтернативы, используемые в литературе по проверке экспоненциал ьности: альтернативу Вейбулла с д{х) = (в + 1) хеехр (—х1+в), х ^ 0- альтернативу Макехама с д{х) = (1 + 0(1 — ехр (—х))) ехр (—х — 0(ехр (-х) — 1 + х)), х ^ 0- альтернативу линейности функции интенсивности отказов с д (х) = (1 + вх) ехр[—ж — ^вх2], х^О.

Для предложенных выше двух статистик выписываются предельные распределения при нулевой гипотезе:

Теорема 3.2.1 Для статистики И£ при п —* оо имеет место соотношение где Дз (а) определена в (3.2.2). Теорема 3.3.1 Для статистики п при п —> оо имеет место соотношение

Щ0,(т + 1)2А1(т)), где Д4 (т) определена в (3.3.6).

Поскольку обе статистики зависят от параметров, а и т, то мы устанавливаем, при каких значениях параметров АОЭ по Бахадуру достигают своих максимумов и находим эти значения. Кроме того, мы строим альтернативу, при которой максимум достигается в точке, а ф ½.

Четвертая глава посвящена проверке гипотезы о нормальности. Существует множество характеризаций нормального закона как одного из центральных законов теории вероятностей и математической статистики, и две монографии, посвященные исключительно этому вопросу , . Мы рассмотрим слегка упрощенный вариант известной характери-зации из и :

Пусть Хг, Х2, ., Хт — центрированные н.о.р.с.в., имеющие ф.р. о константы а, а-2,., ат таковы, что 0 < а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Пусть Х, ., Хп выборка с ф.р. G. Основываясь на этой характериза-ции, мы можем проверить основную гипотезу Я0, которая состоит в том, что G есть ф.р. нормального закона Фа (х) = Ф (х/а), против альтернативы Hi, состоящей в том, что G ф Фа. Строится обычная эмпирическая ф.р. Gn и V-статистическая ф.р. п ^

Bm, n (t) = п~т (Е 1 + - + < *}),

1.¿-т=1 с

Здесь и в дальнейшем символ, а означает суммирование по всем перестановкам индексов. Критерии для проверки нормальности могут быть основаны на следующих статистиках:

В, п = Г dGn (t), J —00 оо

BmAt)-Gn (t)]dGn (t), оо

Bin = Г автора Кремлев Сергей

Оптимальный вариант Анализ возможных сценариев развития событий неизбежно заставляет задуматься о выборе оптимального варианта. Нельзя сказать, что различные «летние» варианты, то есть альтернативы, привязанные к маю-июню - июлю 1941 г., внушают оптимизм. Нет, они,

Оптимальный вариант

Из книги Великая Отечественная альтернатива автора Исаев Алексей Валерьевич

Оптимальный вариант Анализ возможных сценариев развития событий неизбежно заставляет задуматься о выборе оптимального варианта. Нельзя сказать, что различные «летние» варианты, т. е. альтернативы, привязанные к маю - июню - июлю 1941 г., внушают оптимизм. Нет, они,

Оптимальный контроль

Из книги Самооценка у детей и подростков. Книга для родителей автора Эйестад Гюру

Оптимальный контроль Что значит держать в меру крепко? Это вы должны определить сами, исходя из знания собственного ребенка и условий среды, в которой вы живете. В большинстве же случаев родители подростков стараются уберечь своих детей от курения, употребления алкоголя,

Оптимальный путь

Из книги Парадокс перфекциониста автора Бен-Шахар Тал

Оптимальный путь Нас постоянно атакует совершенство. Обложку Men’s Health украшает Адонис, обложку Vogue - Елена Прекрасная; женщины и мужчины на необъятном экране за час-другой улаживают свои конфликты, разыгрывают идеальный сюжет, отдаются идеальной любви. Все мы слышали,

Оптимальный подход

Из книги Эксперт № 07 (2013) автора Эксперт Журнал

Оптимальный подход Сергей Костяев, кандидат политических наук, старший научный сотрудник ИНИОН РАН Министерство обороны США потратило миллиард долларов на неработающую компьютерную программу Фото: EPA С 1 марта расходы Пентагона, вероятно, будут сокращены на 43 млрд

Оптимальный вариант

Из книги Два сезона автора Арсеньев Л

Оптимальный вариант - Скажите, разумно ли играть сразу на нескольких фронтах? - спросили журналисты у Базилевича и Лобановского в самом начале сезона-75.- Неразумно, конечно, - ответили они. - Но нужно. Мы считаем, что обязательно следует дифференцировать значимость

Оптимальный контроль

Из книги Управление личными (семейными) финансами. Системный подход автора Штейнбок Михаил

Оптимальный контроль >> При оптимальном контроле мы все расходы разделяем на две больших группы:– «обычные» – регулярные расходы,– разовые или нестандартные расходы.Оптимальный контроль может использоваться только после нескольких месяцев детального контроля.

В современных условиях интерес к анализу данных постоянно и интенсивно растет в совершенно различных областях, таких как биология, лингвистика, экономика, и, разумеется, IT. Основу этого анализа составляют статистические методы, и разбираться в них необходимо каждому уважающему себя специалисту в data mining.

К сожалению, действительно хорошая литература, такая что умела бы предоставить одновременно математически строгие доказательства и понятные интуитивные объяснения, встречается не очень часто. И данные лекции , на мой взгляд, необычайно хороши для математиков, разбирающихся в теории вероятностей именно по этой причине. По ним преподают магистрам в немецком университете имени Кристиана-Альбрехта на программах «Математика» и «Финансовая математика». И для тех, кому интересно, как этот предмет преподается за рубежом, я эти лекции перевел . На перевод у меня ушло несколько месяцев, я разбавил лекции иллюстрациями, упражнениями и сносками на некоторые теоремы. Замечу, что я не профессиональный переводчик, а просто альтруист и любитель в этой сфере, так что приму любую критику, если она конструктивна.

Вкратце, лекции вот о чем:


Условное математическое ожидание

Эта глава не относится непосредственно к статистике, однако, идеальна для старта её изучения. Условное математическое ожидание - это наилучший выбор для предсказания случайного результата на основе уже имеющейся информации. И это тоже случайная величина. Здесь рассматриваются его различные свойства, такие как линейность, монотонность, монотонная сходимость и прочие другие.

Основы точечного оценивания

Как оценить параметр распределения? Какой для этого выбрать критерий? Какие методы при этом использовать? Эта глава позволяет ответить на все эти вопросы. Здесь вводятся понятия несмещенной оценки и равномерно несмещенной оценки с минимальной дисперсией. Объясняется, откуда берутся распределение хи-квадрат и распределение Стьюдента, и чем они важны при оценивании параметров нормального распределения. Рассказывается, что такое неравенство Рао-Крамера и информация Фишера. Также вводится понятие экспоненциального семейства, многократно облегчающего получение хорошей оценки.

Байесовское и минимаксное оценивания параметров

Здесь описывается иной философский подход к оценке. В данном случае параметр считается неизвестным потому, что он является реализацией некой случайной величины с известным (априорным) распределением. Наблюдая результат эксперимента мы рассчитываем так называемое апостериорное распределение параметра. На основе этого, мы можем получить Байесовскую оценку, где критерием является минимум потерь в среднем, или минимаксную оценку, минимизирующую максимально возможные потери.

Достаточность и полнота

Эта глава имеет серьезное прикладное значение. Достаточная статистика - это функция от выборки, такая что достаточно хранить только результат этой функции для того, чтобы оценить параметр. Таких функций много и среди них выделяют так называемые минимальные достаточные статистики. Например, для оценки медианы нормального распределения достаточно хранить лишь одно число - среднее арифметическое по всей выборке. Работает ли это также для других распределений, например, для распределения Коши? Как достаточные статистики помогают в выборе оценок? Здесь вы можете найти ответы на эти вопросы.

Асимптотические свойства оценок

Пожалуй, самое важное и необходимое свойство оценки - это её состоятельность, то есть стремление к истинному параметру при увеличении размера выборки. В этой главе рассказывается какими свойствами обладают известные нам оценки, полученные описанными в предыдущих главах статистическими методами. Вводятся понятия асимптотической несмещенности, асимптотической эффективности и расстояния Кульбака-Лейблера.

Основы тестирования

Кроме вопроса о том, как оценить неизвестный нам параметр, мы должны каким-то образом проверить, удовлетворяет ли он требуемым свойствам. Например, проводится эксперимент, в ходе которого испытывается новое лекарство. Как узнать, выше ли вероятность выздоровления с ним, нежели чем с использованием старых лекарств? В этой главе объясняется, как строятся подобные тесты. Вы узнаете, что такое равномерно наиболее мощный критерий, критерий Неймана-Пирсона, уровень значимости, доверительный интервал, а также откуда берутся небезызвестные критерий Гаусса и t-критерий.

Асимптотические свойства критериев

Как и оценки, критерии должны удовлетворять определенным асимптотическим свойствам. Иногда могут возникнуть ситуации, когда нужный критерий построить невозможно, однако, используя известную центральную предельную теорему, мы строим критерий, асимптотически стремящийся к необходимому. Здесь вы узнаете, что такое асимптотический уровень значимости, метод отношения правдоподобия, и как строятся критерий Бартлетта и критерий независимости хи-квадрат.

Линейная модель

Эту главу можно рассматривать как дополнение, а именно, применение статистики в случае линейной регрессии. Вы разберетесь в том, какие оценки хороши и в каких условиях. Вы узнаете, откуда взялся метод наименьших квадратов, каким образом строить критерии и зачем нужно F-распределение.