Элементарные понятия статистики

Обзор простых понятий статистики. Это введение представляет собой короткое обсуждение простых понятий, лежащих в базе хоть какой процедуры статистического анализа данных. Мы избрали темы, которые иллюстрируют главные догадки большинства статистических способов, созданных для осознания "численной природы" реальности (Nisbett, et al., 1987). Мы сосредотачиваем основное внимание на "многофункциональных" качествах обсуждаемых понятий Элементарные понятия статистики, отлично понимая, что предлагаемое описание является коротким и не может исчерпать всего предмета обсуждения. Более подробную информацию можно отыскать во вводных разделах и разделах примеров управления юзера системы STATISTICA, также в учебниках по статистике. Мы советуем последующие учебники: Kachigan (1986) и Runyon and Haber (1976); для углубленного обсуждения простой теории и Элементарные понятия статистики главных понятий статистики см. традиционную книжку Kendall and Stuart (1979) (перевод: М.Кендалл и А.Стьюарт "Теория рассредотачиваний" (том 1), "Статистические выводы и связи" (том 2), "Многомерный статистический анализ" (том 3)). На российском языке см., к примеру, книжку: Боровиков В.П. "Пользующееся популярностью введение в программку STATISTICA", Компьютер Пресс 1998, в какой дается пользующееся популярностью Элементарные понятия статистики описание главных статистических понятий.

  • Что такое переменные?
  • Исследование зависимостей в сопоставлении с экспериментальными исследовательскими работами
  • Зависимые и независящие переменные
  • Шкалы измерений
  • Зависимости меж переменными
  • Почему зависимости меж переменными являются необходимыми
  • Две главные черты всякой зависимости меж переменными
  • Что такое статистическая значимость (p-уровень)
  • Как найти, что итог вправду весомым
  • Статистическая значимость Элементарные понятия статистики и количество выполненных анализов
  • Величина зависимости меж переменными в сопоставлении с надежностью зависимости
  • Почему более сильные зависимости меж переменными являются более важными
  • Почему объем подборки оказывает влияние на значимость зависимости
  • Пример: "отношение числа мальчишек к числу девченок"
  • Почему слабенькие зависимости могут быть значимо подтверждены лишь на Элементарные понятия статистики огромных подборках
  • Можно ли отсутствие связей рассматривать как весомый итог?
  • Как измерить величину связи меж переменными
  • Общая конструкция большинства статистических тестов
  • Как рассчитывается статистическая значимость
  • Почему принципиально обычное рассредотачивание
  • Иллюстрация того, как обычное рассредотачивание употребляется в статистических рассуждениях
  • Все ли статистики критериев нормально распределены?
  • Как выяснить последствия нарушений догадок Элементарные понятия статистики нормальности?

Что такое переменные? Переменные - это то, что можно определять, держать под контролем либо что можно изменять в исследовательских работах. Переменные отличаются многими качествами, в особенности той ролью, которую они играют в исследовательских работах, шкалой измерения и т.д.

В начало

Исследование зависимостей в сопоставлении с экспериментальными исследовательскими работами. Большая часть эмпирических Элементарные понятия статистики исследовательских работ данных можно отнести к одному из нареченных типов. В исследовании корреляций (зависимостей, связей...) вы не влияете (либо, по последней мере, пытаетесь не оказывать влияние) на переменные, а только измеряете их и желаете отыскать зависимости (корреляции) меж некими измеренными переменными, к примеру, меж артериальным давлением и уровнем холестерина Элементарные понятия статистики. В экспериментальных исследовательских работах, напротив, вы варьируете некие переменные и измеряете воздействия этих конфигураций на другие переменные. К примеру, исследователь может искусственно наращивать давление крови, а потом на определенных уровнях давления измерить уровень холестерина. Анализ данных в экспериментальном исследовании также приходит к вычислению "корреляций" (зависимостей) меж переменными, а конкретно Элементарные понятия статистики, меж переменными, на которые действуют, и переменными, на которые оказывает влияние это воздействие. Все же, экспериментальные данные потенциально пичкают нас более высококачественной информацией. Только экспериментально можно внушительно обосновать причинную связь меж переменными. К примеру, если найдено, что каждый раз, когда меняется переменная A, меняется и переменная B, то можно Элементарные понятия статистики прийти к выводу - "переменная A влияет на переменную B", т.е. меж переменными А и В имеется причинная зависимость. Результаты корреляционного исследования могут быть проинтерпретированы в каузальных (причинных) определениях на базе некой теории, но сами по для себя не могут ясно обосновать причинность.

В начало

Зависимые и независящие Элементарные понятия статистики переменные. Независящими переменными именуются переменные, которые варьируются исследователем, тогда как зависимые переменные - это переменные, которые измеряются либо регистрируются. Может показаться, что проведение этого различия делает неурядицу в терминологии, так как как молвят некие студенты "все переменные зависят от чего-нибудь". Все же, в один прекрасный момент ясно проведя Элементарные понятия статистики это различие, вы поймете его необходимость. Определения зависимая и независящая переменная используются в главном в экспериментальном исследовании, где экспериментатор манипулирует некими переменными, и в этом смысле они "независимы" от реакций, параметров, целей и т.д. присущих объектам исследования. Некие другие переменные, как подразумевается, должны "зависеть" от действий экспериментатора либо от Элементарные понятия статистики экспериментальных критерий. Другими словами, зависимость проявляется в ответной реакции исследуемого объекта на посланное на него воздействие. Частично в противоречии с данным разграничением понятий находится внедрение их в исследовательских работах, где вы не варьируете независящие переменные, а только приписываете объекты к "экспериментальным группам", основываясь на неких их априорных свойствах. К Элементарные понятия статистики примеру, если в опыте мужчины сравниваются с дамами относительно числа лейкоцитов (WCC), содержащихся в крови, то Пол можно именовать независящей переменной, а WCC зависимой переменной.

В начало

Шкалы измерений. Переменные различаются также тем "как отлично" они могут быть измерены либо, другими словами, как много измеряемой инфы обеспечивает шкала их Элементарные понятия статистики измерений. Разумеется, в каждом измерении находится некая ошибка, определяющая границы "количества инфы", которое можно получить в данном измерении. Другим фактором, определяющим количество инфы, содержащейся в переменной, является тип шкалы, в какой проведено измерение. Различают последующие типы шкал:(a) номинальная, (b) порядковая (ординальная), (c) интервальная (d) относительная (шкала Элементарные понятия статистики дела). Соответственно, имеем четыре типа переменных: (a) номинальная, (b) порядковая (ординальная), (c) интервальная и (d) относительная.

  1. Номинальные переменные употребляются только для высококачественной систематизации. Это значит, что данные переменные могут быть измерены исключительно в определениях принадлежности к неким, значительно разным классам; при всем этом вы не можете найти количество либо Элементарные понятия статистики упорядочить эти классы. К примеру, вы можете сказать, что 2 индивида различимы в определениях переменной А (к примеру, индивиды принадлежат к различным национальностям). Обычные примеры номинальных переменных - пол, национальность, цвет, город и т.д. Нередко номинальные переменные именуют категориальными.
  2. Порядковые переменные позволяют ранжировать (упорядочить) объекты, указав какие из их в большей Элементарные понятия статистики либо наименьшей степени владеют качеством, выраженным данной переменной. Но они не позволяют сказать "на сколько больше" либо "на сколько меньше". Порядковые переменные время от времени также именуют ординальными. Обычный пример порядковой переменной - социоэкономический статус семьи. Мы осознаем, что верхний средний уровень выше среднего уровня, но сказать, что разница меж ними Элементарные понятия статистики равна, скажем, 18% мы не сможем. Само размещение шкал в последующем порядке: номинальная, порядковая, интервальная является неплохим примером порядковой шкалы.
  3. Интервальные переменные позволяют не только лишь упорядочивать объекты измерения, да и численно выразить и сопоставить различия меж ними. К примеру, температура, измеренная в градусах Фаренгейта либо Цельсия, образует Элементарные понятия статистики интервальную шкалу. Вы сможете не только лишь сказать, что температура 40 градусов выше, чем температура 30 градусов, да и что повышение температуры с 20 до 40 градусов в два раза больше роста температуры от 30 до 40 градусов.
  4. Относительные переменные очень похожи на интервальные переменные. В дополнение ко всем свойствам переменных, измеренных в интервальной шкале, их соответствующей Элементарные понятия статистики чертой является наличие определенной точки абсолютного нуля, таким макаром, для этих переменных являются обоснованными предложения типа: x в два раза больше, чем y. Обычными примерами шкал отношений являются измерения времени либо места. К примеру, температура по Кельвину образует шкалу дела, и вы сможете не только лишь утверждать, что температура 200 градусов Элементарные понятия статистики выше, чем 100 градусов, да и что она в два раза выше. Интервальные шкалы (к примеру, шкала Цельсия) не владеют данным свойством шкалы дела. Заметим, что в большинстве статистических процедур не делается различия меж качествами интервальных шкал и шкал дела.
В начало

Связи меж переменными. Независимо от типа, две Элементарные понятия статистики либо более переменных связаны (зависимы) меж собой, если наблюдаемые значения этих переменных распределены согласованным образом. Другими словами, мы говорим, что переменные зависимы, если их значения периодическим образом согласованы вместе в имеющихся у нас наблюдениях. К примеру, переменные Пол и WCC (число лейкоцитов) могли бы рассматриваться как зависимые, если б Элементарные понятия статистики большая часть парней имело высочайший уровень WCC, а большая часть дам - маленький WCC, либо напротив. Рост связан с Весом, так как обычно высочайшие индивиды тяжелее низких; IQ (коэффициент ума) связан с Количеством ошибок в тесте, т.к. люди высочайшим значением IQ делают меньше ошибок и т.д.

В начало Элементарные понятия статистики

Почему зависимости меж переменными являются необходимыми. Вообщем говоря, конечная цель всякого исследования либо научного анализа состоит в нахождение связей (зависимостей) меж переменными. Философия науки учит, что не существует другого метода представления познания, не считая как в определениях зависимостей меж количествами либо свойствами, выраженными какими-либо переменными. Таким Элементарные понятия статистики макаром, развитие науки всегда заключается в нахождении новых связей меж переменными. Исследование корреляций по существу состоит в измерении таких зависимостей конкретным образом. Все же, экспериментальное исследование не является в этом смысле кое-чем хорошим. К примеру, отмеченное выше экспериментальное сопоставление WCC у парней и дам может быть описано как поиск связи Элементарные понятия статистики меж переменными: Пол и WCC. Предназначение статистики заключается в том, чтоб посодействовать беспристрастно оценить зависимости меж переменными. Вправду, все сотки обрисованных в данном руководстве процедур могут быть проинтерпретированы в определениях оценки разных типов взаимосвязей меж переменными.

В начало

Две главные черты всякой зависимости меж переменными. Можно отметить два самых Элементарные понятия статистики обычных характеристики зависимости меж переменными: (a) величина зависимости и (b) надежность зависимости.

  1. Величина. Величину зависимости легче осознать и измерить, чем надежность. К примеру, если хоть какой мужик в вашей выборке имел значение WCC выше чем неважно какая дама, то вы сможете сказать, что зависимость меж 2-мя переменными Элементарные понятия статистики (Пол и WCC) очень высочайшая. Другими словами, вы могли бы предсказать значения одной переменной по значениям другой.
  2. Надежность ("истинность"). Надежность взаимозависимости - наименее приятное понятие, чем величина зависимости, но очень принципиальное. Надежность зависимости конкретно связана с репрезентативностью определенной подборки, на базе которой строятся выводы. Другими словами, надежность гласит нам о том, как Элементарные понятия статистики возможно, что зависимость, схожая отысканной вами, будет вновь найдена (другими словами, подтвердится) на данных другой подборки, извлеченной из той же самой популяции. Следует держать в голове, что конечной целью практически никогда не является исследование данной определенной подборки; подборка представляет энтузиазм только постольку, так как она дает информацию обо всей Элементарные понятия статистики популяции. Если ваше исследование удовлетворяет неким особым аспектам (об этом будет сказано позднее), то надежность отысканных зависимостей меж переменными вашей подборки можно количественно оценить и представить при помощи стандартной статистической меры (именуемой p-уровень либо статистический уровень значимости, подробнее см. в последующем разделе).
В начало

Что такое статистическая Элементарные понятия статистики значимость (p-уровень)? Статистическая значимость результата представляет собой оцененную меру убежденности в его "истинности" (в смысле "репрезентативности подборки"). Выражаясь более на техническом уровне, p-уровень (этот термин был в первый раз применен в работе Brownlee, 1960) это показатель, находящийся в убывающей зависимости от надежности результата. Более высочайший p- уровень соответствует Элементарные понятия статистики более низкому уровню доверия к отысканной в выборке зависимости меж переменными. Конкретно, p-уровень представляет собой возможность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. К примеру, p- уровень = .05 (т.е. 1/20) указывает, что имеется 5% возможность, что отысканная в выборке связь меж переменными является только случайной особенностью данной подборки. Другими словами Элементарные понятия статистики, если данная зависимость в популяции отсутствует, а вы неоднократно проводили бы подобные опыты, то приблизительно в одном из 20 повторений опыта можно было бы ждать таковой же либо более сильной зависимости меж переменными. (Отметим, что это не то же самое, что утверждать о заведомом наличии зависимости меж переменными, которая в Элементарные понятия статистики среднем может быть воспроизведена в 5% либо 95% случаев; когда меж переменными популяции существует зависимость, возможность повторения результатов исследования, показывающих наличие этой зависимости именуется статистической мощностью плана. Подробнее об этом см. в разделе Анализ мощности). В почти всех исследовательских работах p-уровень .05 рассматривается как "применимая граница" уровня ошибки.

В начало

Как Элементарные понятия статистики найти, является ли итог вправду весомым. Не существует никакого метода избежать произвола при принятии решения о том, какой уровень значимости следует вправду считать "весомым". Выбор определенного уровня значимости, выше которого результаты отвергаются как неверные, является довольно произвольным. На практике окончательное решение обычно находится в зависимости от того Элементарные понятия статистики, был ли итог предсказан априори (т.е. до проведения опыта) либо найден апостериорно в итоге многих анализов и сравнений, выполненных с обилием данных, также на традиции, имеющейся в данной области исследовательских работ. Обычно в почти всех областях итог p .05 является применимой границей статистической значимости, но следует держать в голове Элементарные понятия статистики, что этот уровень все еще включает достаточно огромную возможность ошибки (5%). Результаты, важные на уровне p .01 обычно рассматриваются как статистически важные, а результаты с уровнем p .005 либо p . 001 как высоко важные. Но следует осознавать, что данная систематизация уровней значимости довольно произвольна и является всего только неформальным соглашением, принятым на базе практического опыта Элементарные понятия статистики в той либо другой области исследования.

В начало

Статистическая значимость и количество выполненных анализов. Понятно, что чем больше число анализов вы проведете с совокупой собранных данных, тем большее число важных (на избранном уровне) результатов будет найдено чисто случаем. К примеру, если вы вычисляете корреляции меж 10 переменными (имеете 45 разных Элементарные понятия статистики коэффициентов корреляции), то можно ждать, что приблизительно два коэффициента корреляции (один на каждые 20) чисто случаем окажутся важными на уровне p .05, даже если переменные совсем случайны и некоррелированы в популяции. Некие статистические способы, включающие много сравнений, и, таким макаром, имеющие неплохой шанс повторить такового рода ошибки, создают специальную корректировку либо поправку Элементарные понятия статистики на общее число сравнений. Все же, многие статистические способы (в особенности обыкновенные способы разведочного анализа данных) не предлагают какого-нибудь метода решения данной задачи. Потому исследователь должен с осторожностью оценивать надежность внезапных результатов.

В начало

Величина зависимости меж переменными в сопоставлении с надежностью зависимости. Как было уже Элементарные понятия статистики сказано, величина зависимости и надежность представляют две разные свойства зависимостей меж переменными. Все же, нельзя сказать, что они совсем независимы. Говоря общим языком, чем больше величина зависимости (связи) меж переменными в выборке обыденного объема, тем паче она надежна (см. последующий раздел).

В начало

Почему более сильные зависимости меж переменными являются Элементарные понятия статистики более важными. Если полагать отсутствие зависимости меж надлежащими переменными в популяции, то более возможно ждать, что в исследуемой выборке связь меж этими переменными также будет отсутствовать. Таким макаром, чем более мощная зависимость найдена в выборке, тем наименее возможно, что этой зависимости нет в популяции, из которой она извлечена. Как вы Элементарные понятия статистики видите, величина зависимости и значимость плотно сплетены меж собой, и можно было бы попробовать вывести значимость из величины зависимости и напротив. Но обозначенная связь меж зависимостью и значимостью имеет место только при фиксированном объеме подборки, так как при разных объемах подборки одна и та же зависимость Элементарные понятия статистики возможно окажется как высоко важной, так и незначимой совсем (см. последующий раздел)

В начало

Почему объем подборки оказывает влияние на значимость зависимости. Если наблюдений не много, то соответственно имеется не достаточно вероятных композиций значений этих переменных и таким макаром, возможность случайного обнаружения композиции значений, показывающих сильную зависимость, относительно велика. Разглядим последующий Элементарные понятия статистики пример. Если вы исследуете зависимость 2-ух переменных (Пол: мужик/дама и WCC: высочайший/маленький) и имеете только 4 субъекта в выборке (2 мужчины и 2 дамы), то возможность того, что чисто случаем вы отыщите 100% зависимость меж 2-мя переменными равна 1/8. Более точно, возможность того, что оба мужчины имеют высочайший WCC, а обе Элементарные понятия статистики дамы - маленький WCC, либо напротив, - равна 1/8. Сейчас разглядим возможность подобного совпадения для 100 субъектов; просто созидать, что эта возможность равна фактически нулю. Разглядим более общий пример. Представим популяцию, в какой среднее значение WCC парней и дам одно и тоже. Если вы будете повторять опыт, состоящий в извлечении пары случайных Элементарные понятия статистики выборок (одна подборка - мужчины, другая подборка - дамы), а потом вычислите разности выборочных средних WCC для каждой пары выборок, то в большинстве тестов итог будет близок к 0. Но временами, будут встречаться пары выборок, в каких различие меж средним количеством лейкоцитов у парней и дам будет значительно отличаться от 0. Как нередко это будет происходить Элементарные понятия статистики? Разумеется, чем меньше объем подборки в каждом опыте, тем паче возможно возникновение таких неверных результатов, которые демонстрируют существование зависимости меж полом и WCC в данных, приобретенных из популяции, где такая зависимость по сути отсутствует.

В начало

Пример: "отношение числа новорожденных мальчишек к числу новорожденных девченок" Разглядим последующий пример, взятый Элементарные понятия статистики из Nisbett, et al., 1987. Имеются 2 поликлиники. Представим, что в первой из их раз в день рождается 120 малышей, во 2-ой только 12. В среднем отношение числа мальчишек, рождающихся в каждой поликлинике, к числу девченок 50/50. В один прекрасный момент девченок родилось в два раза больше, чем мальчишек. Спрашивается, для какой поликлиники Элементарные понятия статистики данное событие более возможно? Ответ предельно ясен для статистика, но, он не настолько очевиден неискушенному. Естественно, такое событие еще более возможно для малеханькой поликлиники. Разъяснение этого факта заключается в том, что возможность случайного отличия (от среднего) растет с уменьшением объема подборки.

В начало

Почему слабенькие связи могут быть значимо Элементарные понятия статистики подтверждены лишь на огромных подборках. Пример из предшествующего раздела указывает, что если связь меж переменными "беспристрастно" слабенькая (т.е. характеристики подборки близки к свойствам популяции), то не существует другого метода проверить такую зависимость не считая как изучить подборку довольно огромного объема. Даже если подборка, находящаяся в вашем распоряжении, совсем репрезентативна Элементарные понятия статистики, эффект не будет статистически весомым, если подборка мала. Аналогично, если зависимость "беспристрастно" (в популяции) очень мощная, тогда она может быть найдена с высочайшей степенью значимости даже на очень малеханькой выборке. Разглядим пример. Представьте, что вы бросаете монету. Если монета немного несимметрична, и при подкидывании орел выпадает Элементарные понятия статистики почаще решки (к примеру, в 60% подкидываний выпадает орел, а в 40% решка), то 10 подкидываний монеты было бы не довольно, чтоб уверить кого бы то ни было, что монета асимметрична, даже если был бы получен, казалось, совсем репрезентативный итог: 6 орлов и 4 решки. Не следует ли отсюда, что 10 подкидываний вообщем не могут обосновать что-либо Элементарные понятия статистики? Нет, не следует, так как если эффект, в принципе, очень сильный, то 10 подкидываний возможно окажется полностью довольно для его подтверждения. Представьте, что монета так несимметрична, что каждый раз, когда вы ее бросаете, выпадает орел. Если вы бросаете такую монету 10 раз, и каждый раз выпадает орел, большая часть Элементарные понятия статистики людей сочтут это убедительным подтверждением того, что с монетой что-то не то. Другими словами, это послужило бы убедительным подтверждением того, что в популяции, состоящей из нескончаемого числа подкидываний этой монеты орел будет встречаться почаще, чем решка. В конечном итоге этих рассуждений мы приходим к выводу: если зависимость Элементарные понятия статистики мощная, она может быть найдена с высочайшим уровнем значимости даже на малой выборке.

В начало

Можно ли отсутствие связей рассматривать как весомый итог? Чем слабее зависимость меж переменными, тем большего объема требуется подборка, чтоб значимо ее найти. Представьте, как много бросков монеты нужно сделать, чтоб обосновать, что отклонение от равной вероятности выпадения Элементарные понятия статистики сокола и решки составляет только .000001%! Нужный малый размер подборки увеличивается, когда степень эффекта, который необходимо обосновать, убывает. Когда эффект близок к 0, нужный объем подборки для его ясного подтверждения приближается к бесконечности. Другими словами, если зависимость меж переменными практически отсутствует, объем подборки, нужный для важного обнаружения зависимости, практически Элементарные понятия статистики равен объему всей популяции, который подразумевается нескончаемым. Статистическая значимость представляет возможность того, что схожий итог был бы получен при проверке всей популяции в целом. Таким макаром, все, что получено после тестирования всей популяции было бы, по определению, весомым на наивысшем, вероятном уровне и это относится ко всем результатам типа Элементарные понятия статистики "нет зависимости".

В начало

Как измерить величину зависимости меж переменными. Статистиками создано много разных мер связи меж переменными. Выбор определенной меры в определенном исследовании находится в зависимости от числа переменных, применяемых шкал измерения, природы зависимостей и т.д. Большая часть этих мер, все же, подчиняются общему принципу: они пробуют оценить наблюдаемую Элементарные понятия статистики зависимость, сравнивая ее с "наибольшей мыслимой зависимостью" меж рассматриваемыми переменными. Говоря на техническом уровне, обыденный метод выполнить такие оценки состоит в том, чтоб поглядеть как варьируются значения переменных и потом подсчитать, какую часть всей имеющейся варианты можно разъяснить наличием "общей" ("совместной") варианты 2-ух (либо более) переменных Элементарные понятия статистики. Говоря наименее техническим языком, вы сравниваете то "что есть общего в этих переменных", с тем "что потенциально было бы у их общего, если б переменные были полностью зависимы". Разглядим обычной пример. Пусть в вашей выборке, средний показатель (число лейкоцитов) WCC равен 100 для парней и 102 для дам. Как следует, вы могли Элементарные понятия статистики бы сказать, что отклонение каждого личного значения от общего среднего (101) содержит компоненту связанную с полом субъекта и средняя величина ее равна 1. Это значение, таким макаром, представляет некую меру связи меж переменными Пол и WCC. Естественно, это очень бедная мера зависимости, потому что она не дает никакой инфы о том, как велика Элементарные понятия статистики эта связь, скажем относительно общего конфигурации значений WCC. Разглядим последние способности:

  1. Если все значения WCC у парней могли быть точно равны 100, а у дам 102, то все отличия значений от общего среднего в выборке всецело объяснялись бы полом индивида. Потому вы могли бы сказать, что пол полностью коррелирован (связан) с Элементарные понятия статистики WCC, другими словами, 100% наблюдаемых различий меж субъектами в значениях WCC объясняются полом субъектов.
  2. Если же значения WCC лежат в границах 0-1000, то та же разность (2) меж средними значениями WCC парней и дам, обнаруженная в опыте, составляла бы настолько малую толику общей варианты, что приобретенное различие (2) числилось бы пренебрежимо Элементарные понятия статистики малым. Рассмотрение еще 1-го субъекта могло бы поменять разность либо даже поменять ее символ. Потому всякая не плохая мера зависимости должна принимать во внимание полную изменчивость личных значений в выборке и оценивать зависимость по тому, как эта изменчивость разъясняется изучаемой зависимостью.
В начало

Общая конструкция большинства статистических критериев. Потому что конечная Элементарные понятия статистики цель большинства статистических критериев (тестов) состоит в оценивании зависимости меж переменными, большая часть статистических тестов следуют общему принципу, объясненному в прошлом разделе. Говоря техническим языком, эти испытания представляют собой отношение изменчивости, общей для рассматриваемых переменных, к полной изменчивости. К примеру, таковой тест может представлять собой отношение той части Элементарные понятия статистики изменчивости WCC, которая определяется полом, к полной изменчивости WCC (вычисленной для объединенной подборки парней и дам). Это отношение обычно именуется отношением объясненной варианты к полной варианты. В статистике термин объясненная вариация не непременно значит, что вы даете ей "теоретическое разъяснение". Он употребляется только для обозначения общей варианты рассматриваемых переменных, другими Элементарные понятия статистики словами, для указания на то, что часть варианты одной переменной "разъясняется" определенными значениями другой переменной и напротив.

В начало

Как рассчитывается уровень статистической значимости. Представим, вы уже вычислили меру зависимости меж 2-мя переменными (как разъяснялось выше). Последующий вопрос, стоящий перед вами: "как значима эта зависимость?" К Элементарные понятия статистики примеру, является ли 40% объясненной дисперсии меж 2-мя переменными достаточным, чтоб считать зависимость важной? Ответ: "зависимо от событий". Конкретно, значимость зависит в главном от объема подборки. Как уже разъяснялось, в очень огромных подборках даже очень слабенькие зависимости меж переменными будут важными, в то время как в малых подборках даже очень сильные зависимости Элементарные понятия статистики не являются надежными. Таким макаром, для того чтоб найти уровень статистической значимости, вам нужна функция, которая представляла бы зависимость меж "величиной" и "значимостью" зависимости меж переменными для каждого объема подборки. Данная функция указала бы вам точно "как возможно получить зависимость данной величины (либо больше) в выборке данного Элементарные понятия статистики объема, в предположении, что в популяции таковой зависимости нет". Другими словами, эта функция давала бы уровень значимости (p -уровень), и, как следует, возможность неверно отклонить предположение об отсутствии данной зависимости в популяции. Эта "другая" догадка (состоящая в том, что нет зависимости в популяции) обычно именуется нулевой догадкой. Было бы совершенно, если Элементарные понятия статистики б функция, вычисляющая возможность ошибки, была линейной и имела только разные наклоны для различных объемов подборки. К огорчению, эта функция значительно более непростая и не всегда точно одна и та же. Все же, почти всегда ее форма известна, и ее можно использовать для определения уровней значимости при исследовании выборок Элементарные понятия статистики данного размера. Большая часть этих функций связано с очень принципиальным классом рассредотачиваний, именуемым обычным.

В начало

Почему принципиально Обычное рассредотачивание. Обычное рассредотачивание принципиально по многим причинам. Почти всегда оно является неплохим приближением функций, определенных в прошлом разделе (более подробное описание см. в разделе Все ли статистики критериев нормально распределены Элементарные понятия статистики?). Рассредотачивание многих статистик является обычным либо может быть получено из обычных при помощи неких преобразований. Рассуждая философски, можно сказать, что обычное рассредотачивание представляет собой одну из эмпирически испытанных истин относительно общей природы реальности и его положение может рассматриваться как один из базовых законов природы. Четкая форма обычного Элементарные понятия статистики рассредотачивания (соответствующая "колоколообразная кривая") определяется только 2-мя параметрами: средним и стандартным отклонением.

Свойственное свойство обычного рассредотачивания заключается в том, что 68% всех его наблюдений лежат в спектре ±1 стандартное отклонение от среднего, а спектр ±2 стандартных отличия содержит 95% значений. Другими словами, при обычном рассредотачивании, стандартизованные наблюдения, наименьшие -2 либо огромные +2, имеют относительную частоту Элементарные понятия статистики наименее 5% (Стандартизованное наблюдение значит, что из начального значения вычтено среднее и итог поделен на стандартное отклонение (корень из дисперсии)). Если у вас имеется доступ к пакету STATISTICA, Вы сможете вычислить четкие значения вероятностей, связанных с разными значениями обычного рассредотачивания, используя Вероятностный калькулятор; к примеру, если задать z-значение (т Элементарные понятия статистики.е. значение случайной величины, имеющей стандартное обычное рассредотачивание) равным 4, соответственный вероятностный уровень, вычисленный STATISTICA будет меньше .0001, так как при обычном рассредотачивании фактически все наблюдения (т.е. более 99.99%) попадут в спектр ±4 стандартных отличия.

В начало

Иллюстрация того, как обычное рассредотачивание употребляется в статистических рассуждениях (индукция). Напомним пример, обсуждавшийся выше, когда пары Элементарные понятия статистики выборок парней и дам выбирались из совокупы, в какой среднее значение WCC для парней и дам было в точности одно и то же. Хотя более возможный итог таких тестов (одна пара выборок на опыт) заключается в том, что разность меж средними WCC для парней и дам для каждой пары близка Элементарные понятия статистики к 0, время от время возникают пары выборок, в каких эта разность значительно отличается от 0. Как нередко это происходит? Если объем выборок довольно большой, то разности "нормально распределены" и зная форму обычной кривой, вы сможете точно высчитать возможность случайного получения результатов, представляющих разные уровни отличия среднего от 0 - значения гипотетичного Элементарные понятия статистики для всей популяции. Если вычисленная возможность так мала, что удовлетворяет принятому заблаговременно уровню значимости, то можно сделать только один вывод: ваш итог лучше обрисовывает характеристики популяции, чем "нулевая догадка". Следует держать в голове, что нулевая догадка рассматривается только по техническим суждениям как исходная точка, с которой сопоставляются эмпирические результаты. Отметим Элементарные понятия статистики, что все это рассуждение основано на предположении о нормальности рассредотачивания этих повторных выборок (т.е. нормальности выборочного рассредотачивания). Это предположение дискуссируется в последующем разделе.

В начало

Все ли статистики критериев нормально распределены? Не все, но большая часть из их или имеют обычное рассредотачивание, или имеют рассредотачивание, связанное Элементарные понятия статистики с обычным и вычисляемое на базе обычного, такое как t, F либо хи-квадрат. Обычно эти критериальные статистики требуют, чтоб анализируемые переменные сами были нормально распределены в совокупы. Многие наблюдаемые переменные вправду нормально распределены, что является еще одним аргументом в пользу того, что обычное рассредотачивание представляет "базовый закон". Неувязка Элементарные понятия статистики может появиться, когда пробуют применить испытания, основанные на предположении нормальности, к данным, не являющимся нормальными (смотри аспекты нормальности в разделах Непараметрическая статистика и рассредотачивания либо Дисперсионный анализ). В этих случаях вы сможете избрать одно из 2-ух. Во-1-х, вы сможете использовать другие "непараметрические" испытания (так именуемые "свободно распределенные аспекты Элементарные понятия статистики", см. раздел Непараметрическая статистика и рассредотачивания). Но это нередко неловко, так как обычно эти аспекты имеют наименьшую мощность и владеют наименьшей гибкостью. Как кандидатуру, в почти всех случаях вы сможете все таки использовать испытания, основанные на предположении нормальности, если убеждены, что объем подборки довольно велик. Последняя возможность базирована на очень Элементарные понятия статистики принципиальном принципе, позволяющем осознать популярность тестов, основанных на нормальности. А конкретно, при возрастании объема подборки, форма выборочного рассредотачивания (т.е. рассредотачивание выборочной статистики аспекта , этот термин был в первый раз применен в работе Фишера, Fisher 1928a) приближается к обычной, даже если рассредотачивание исследуемых переменных не является обычным. Этот Элементарные понятия статистики принцип иллюстрируется последующим анимированным роликом, показывающим последовательность выборочных рассредотачиваний (приобретенных для последовательности выборок растущего размера: 2, 5, 10, 15 и 30), соответственных переменным с очевидно выраженным отклонением от нормальности, т.е. имеющих приметную асимметричность рассредотачивания.

Но по мере роста размера подборки, применяемой для получения рассредотачивания выборочного среднего, это рассредотачивание приближается к нормальному. Отметим, что при Элементарные понятия статистики размере подборки n=30, выборочное рассредотачивание "практически" нормально (см. на близость полосы подгонки). Этот принцип именуется центральной предельной аксиомой (в первый раз этот термин был применен в работе Polya, 1920; по-немецки "Zentraler Grenzwertsatz").

В начало


elementarnie-umozaklyucheniya.html
elementarnie-zakoni-izobiliya-13-glava.html
elementarnie-zakoni-izobiliya-18-glava.html