Страницы

Поиск по вопросам

четверг, 26 декабря 2019 г.

Проверка гипотезы о равновероятности распределения ГПСЧ: смысл эксперементального значения Хи-квадрат

#python_3x #статистика #генерация_случайных_данных #статический_анализ


Есть гпсч на основе линейного конгруэнтного метода. Нужно проверить гипотезу о равновероятности
распределения полученных с помощью генератора значений выборок. Написал такую функцию:

def xi_check(num_array):
    intervals = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    for i in range(len(num_array)):
        intervals[num_array[i]//10] += 1
    xi_2_theor = [0, 3.33, 5.9, 8.34, 11.4, 16.9, 100] # квантили Хи-квадрат
    xi_2_inter = [1, 0.95, 0.75, 0.50, 0.25, 0.05, 0]  # уровень значимости
    xi_2_exp = 0
    for i in range(len(intervals)):
        xi_2_exp = xi_2_exp + ((float(intervals[i]) / float(len(num_array))
        - 0.1) ** 2) / 0.1
    for i in range(6):
        if xi_2_theor[i] <= xi_2_exp <= xi_2_theor[i+1]:
            return f"{xi_2_inter[i]} - {xi_2_inter[i+1]}", xi_2_exp
        else:
            return "Error", xi_2_exp


Если на выходе я получаю эксперементальное значение Хи-квадрат в промежутке между
11.4 и 16.9, то что это означает для меня? Можно ли полагаться на то, что ГПСЧ пораждает
равновероятные значения последовательности?

Иными словами, я не могу понять, как можно трактовать уровень значимости. Как из
него получить вероятность достоверности?
1 - (уровень значимости)?
    


Ответы

Ответ 1



Проверка, которую вы задумали провести, в общем случае называется «проверка выборки на соответствии теоретическому закону распределения». Может выполняться множеством разных методов - Колмогорова-Смирнова, Крамера-фон Мизеса, Джинни ….. и в том числе с помощью использования ХИ-квадрат критерия согласия Пирсона. Суть ее в том, что вы высчитываете некую статистику и сравниваете с тем значением, которое она (статистика) бы имела, если бы ваша выборка соответствовала бы теоретическому закону. В случае использование ХИ-квадрат критерия в качестве такой статистики используется ХИкв.практ= СУММА по количеству квантилей ((Ni-Ei)**2)/Ei) (обратите внимание, это несколько отлично от формулы, которую вы используете в программе). Затем происходит сравнение ХИкв.практ со значением, взятым из таблицыХИкв.крит. при выбранном значении уровня значимости и заданном значением степени свободы. Если полученное значение , меньше значения ХИкв.крит (альфа, df), то считается, что со степенью значимости («уверенности») альфа ваша выборка не отличается от теоретического (в данном случае - равномерного) распределения. Замечание 1. Иметь таблицу распределений сегодня уже не является обязательным – практически все инструменты – от Python до EXCEL – содержат функции, которые эти значения определяют самостоятельно. По той же причине и нет необходимости огород городить с самостоятельным Монте-Карло-моделированием. Замечание 2. Для анализа соответствие именно равномерному закону распределения есть и специальные критерии, например – Шермана, Неймана-Бартона и др. Вот как-то так.

Комментариев нет:

Отправить комментарий