Выборочная совокупность обычно формируется таким образом, чтобы при минимуме единиц отбора с определенной степенью вероятности была смоделирована генеральная совокупность с учетом характеристик, достаточно значимых с точки зрения задач исследования. Свойство выборки моделировать эти характеристики называется Репрезентативностью.
Основным принципом Вероятностного способа создания выборки является равенство шансов попадания в нее для всех элементов (индивидов или группы), составляющих генеральную совокупность.
Первой предпосылкой для этого является определение Основы вероятностной выборки – перечня элементов генеральной совокупности, который должен удовлетворять требованиям полноты, точности, адекватности и удобства работы с ним. Основой могут служить алфавитные списки (картотеки) сотрудников упреждения, классные журналы в школе и т. п. Специально создаваемой основой для различных типов исследований может быть Социальная карта региона, города и т. п., в которой систематизируется информация о размещении половозрастнойи социальной структуре, движении населения, об условиях труда и досуга.
По сформированной основе различными процедурами осуществляется а) простая случайная бесповторная выборка и б) простая случайная повторная выборка. Простая случайная бесповторная выборка предполагает отбор единиц анализа наугад из генеральной совокупности, например, из картотеки, в которую включены все сотрудники организации. Или с помощью таблиц случайных чисел отбираются номера из алфавитного списка. При организации бесповторного отбора пропускаются одни и те же числа, попадающиеся повторно. Если же работают по картотеки, то попавшие в выборку карточки не возвращаются в картотеку.
Для определения репрезентативности и объема простой случайной выборки «Рабочая книга социолога» (1988, с. 212) рекомендует следующую таблицу формул:
Способ отбора |
Отбор по качественному признаку (для доли) |
||
Средняя ошибка |
Предельная ошибка |
Объем выборки |
|
Повторный случайный |
|
|
|
Способ отбора |
Отбор по количественному признаку (для средней) |
||
Средняя ошибка |
Предельная ошибка |
Объем выборки |
|
Повторный случайный |
|
|
|
Обозначения:
M — средняя ошибка выборки
P – доля единиц с данным значением признака
Q=1-P – доля единиц, в которых этот признак отсутствует,
N – объем выборки
— предельная ошибка
Z – числа, определяемые по таблице критических точек стандартного нормального распределения, дисперсия генеральной совокупности
Примечание. Дисперсию генеральной совокупности при недостатке информации о ней можно приблизительно рассчитать одним из таких способов:
1. Используя соотношение (V) связи среднеквадратического отношения с вариационным размахом , для
,
, например, для группы из 500 сотрудников трудоспособного возраста (от 16 до 60 лет)
.
2. Средняя дисперсия нескольких пилотажных выборок в массиве генеральной совокупности принимается за дисперсию последней.