'
Дажы А.Б-Д.
ПАРАДОКСЫ В МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ *
Аннотация:
парадоксы в математической статистике - в этой работе рассматриваются вопросы, связанные с оценками наименьших квадратов и максимального правдоподобия, регрессией, достаточной статистикой и доверительными интервалами. В статье отмечается, что статистические выводы верны только при соблюдении определенных вероятностных условий, а парадоксы иллюстрируют пределы применимости статистических методов
Ключевые слова:
парадокс Берксона, скрытые переменные, парадокс Симпсона
УДК 519.2
Дажы А.Б-Д.
студентка 3курса по направлению подготовки
44.03.05 Педагогическое образование с двумя профилями подготовки «Математика» и «Информатика»
Тувинский государственный университет
(г. Кызыл, Россия)
ПАРАДОКСЫ В МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ
Аннотация: парадоксы в математической статистике - в этой работе рассматриваются вопросы, связанные с оценками наименьших квадратов и максимального правдоподобия, регрессией, достаточной статистикой и доверительными интервалами. В статье отмечается, что статистические выводы верны только при соблюдении определенных вероятностных условий, а парадоксы иллюстрируют пределы применимости статистических методов.
Ключевые слова: парадокс Берксона, скрытые переменные, парадокс Симпсона.
Парадоксы в математической статистике являются важной проблемой в прикладной математике. Они могут приводить к ошибочным выводам и неправильным решениям в различных отраслях, таких как экономика, медицина и наука. Понимание и разрешение этих парадоксов является необходимым для того, чтобы получать точные и достоверные выводы на основе статистических данных. В этой статье мы рассмотрим топ 3 наиболее распространенных статистических парадокса:
Парадокс Берксона
Парадокс Берксона заключается в неверном выводе о зависимости событий A и B, если мы наблюдаем только те исходы, для которых выполняется хотя бы одно из событий A или B.
Пусть в городе А живут 100 девушек, 10 из них красивы и 10 умны, и события "случайно выбранная девушка умна" и "случайно выбранная девушка красива" независимы, т.е. ровно одна девушка одновременно умна и красива. Действительно, если 1/10 всех девушек умны, то для того, чтобы эти мероприятия были независимыми, среди красавиц также должна быть 1/10 умных девушек, т.е. будут умные красавицы (1/10) × 10 = 1.
Теперь давайте посмотрим на ту же ситуацию с точки зрения жителя города, которому рассказывают только о тех девушках, которые ему интересны: умницах или красавицах. Он знает о 19 девушках из этого города: 10 умницах, 10 красавицах, но единственная умная красавица числится в обеих десятках. Итак, с точки зрения этого наблюдателя, вероятность того, что девушка умна, равна 10/19, вероятность того, что девушка умна, при условии, что она красива, все та же 1/10. Итак, по мнению этого наблюдателя, события зависимы, у них есть обратная связь — по его мнению, среди красавиц умных девушек меньше, чем среди всех девушек.
Скрытые переменные
Рассмотрим, например, соотношение между количеством пожарных, задействованных в тушении пожара, и количеством людей, пострадавших в результате. Мы ожидаем, что увеличение числа пожарных улучшит результат, но в агрегированных данных прослеживается прямая корреляция: чем больше задействовано пожарных, тем выше число пострадавших!
Парадокс скрытой переменной: "серьезность пожара" является скрытой переменной для "n задействованных пожарных" и для "n жертв". Действительно, более серьезные пожары, как правило, приводят к большему количеству травм, и в то же время для тушения требуется большое количество пожарных.
Парадокс Симпсона
В области статистики парадокс Симпсона демонстрирует, какие проблемы возникают в результате объединения данных из нескольких групп.
Представьте, что вы проводите A/B эксперимент для повышения конверсии вашего лендинга. Эксперимент проводится два дня, но в первый день сломался распределитель посетителей, и вариант B получил больше посетителей. Во второй день эта проблема была устранена. В результате получились следующие цифры:
|
A |
A |
B |
B |
|
Посетители |
Конверсии |
Посетители |
Конверсии |
День 1 |
400 |
30(7.5%) |
2000 |
140(7%) |
День2 |
1000 |
60(6.0%) |
1000 |
55(5.5%) |
Итого |
1400 |
90(6.4%) |
3000 |
195(6.5%) |
В каждый отдельно взятый день вариант А имел более высокий коэффициент конверсии, но в сумме побеждает вариант B. Это получилось потому, что в день с более высокой конверсией вариант B имел больший трафик. В данном примере неопытный исследователь выкатит вариант B для всего трафика, в то время как на самом деле конверсия повысится, если он использует вариант A.
Следовательно, парадоксы в математической статистике являются важной темой, требующей постоянного изучения и разработки новых методов и стратегий принятия решений на основе статистических данных. Разрешение парадоксов также способствует развитию математической статистики и других дисциплин, связанных с анализом данных, что является важным направлением в современной науке.
СПИСОК ЛИТЕРАТУРЫ:
Номер журнала Вестник науки №8 (65) том 4
Ссылка для цитирования:
Дажы А.Б-Д. ПАРАДОКСЫ В МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ // Вестник науки №8 (65) том 4. С. 319 - 322. 2023 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/9861 (дата обращения: 19.05.2024 г.)
Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2023. 16+
*