Оглавление:
Чтобы сделать оценки о населении, статистики используют случайную выборку, представляющую население. Например, если вы весите 50 случайных американских женщин, вы можете оценить вес всех американских женщин на основе их среднего веса. Ошибка выборки возникает, когда результаты выборки отклоняются от истинного значения совокупности. То есть, если ваши 50 женщин дали средний вес 135 фунтов, когда истинное среднее значение составляло 150 фунтов, тогда ваша ошибка выборки равна -15 (наблюдаемый минус фактический), что означает, что вы недооценили истинное значение на 15 баллов. Поскольку истинное значение редко известно, статистики используют другие оценки, такие как стандартная ошибка и доверительные интервалы, для оценки ошибки выборки.
шаг
Рассчитайте процент, который вы измеряете. Например, если вы хотите знать, какой процент учащихся в данной школе курят сигареты, тогда возьмите случайную выборку (скажем, n, размер нашей выборки равен 30), попросите их заполнить анонимный опрос и рассчитать процент студенты, которые говорят, что они курят. Для иллюстрации, скажем, шесть студентов сказали, что они курят. Затем процент курящих = (# курящих) / (общее количество измеренных студентов) х 100% = 6/30 х 100% = 20%.
шаг
Рассчитайте стандартную ошибку. Поскольку мы не знаем фактического процента курящих студентов, мы можем только приблизить ошибку выборки, рассчитав стандартную ошибку. В статистике мы используем пропорцию p вместо процентов для расчетов, поэтому давайте переведем 20% в пропорцию. Разделив 20% на 100%, вы получите p = 0,20. Стандартная ошибка (SE) для больших размеров выборки = sqrt p x (1 - p) / n, где sqrt x означает получение квадратного корня из x. В этом примере мы получаем SE = sqrt 0,2 x (0,8) / 30 = sqrt 0,00533…? 0,073.
шаг
Создайте доверительный интервал. Нижняя граница: расчетная пропорция - 1,96 x SE = 0,2-1,96 (0,073) = 0,0569 Верхняя граница: расчетная пропорция + 1,96 x SE = 0,2 + 1,96 (0,073) = 0,343 Таким образом, мы бы сказали, что на 95% уверены, что истинная доля курильщиков между 0,0569 и 0,343, или в процентах, 5,69% или 34,3% студентов курят. Этот широкий разброс указывает на возможность довольно большой ошибки выборки.
шаг
Измерьте всех, чтобы вычислить точную ошибку выборки. Сделайте так, чтобы все учащиеся в школе прошли анонимный опрос и подсчитали процент студентов, которые сказали, что они курят. Допустим, что 120 из 800 студентов сказали, что они курили, тогда наш процент составляет 120/800 x 100% = 15%. Следовательно, наша «ошибка выборки» = (оценочная) - (фактическая) = 20 - 15 = 5. Чем ближе к нулю, тем лучше наша оценка и тем меньше говорят о нашей ошибке выборки. Однако в реальной ситуации вы вряд ли узнаете фактическое значение, и вам придется полагаться на SE и доверительный интервал для интерпретации.