Что называется генеральной совокупностью. Генеральная и выборочная совокупности

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (последовательный анализ) и решает многие другие задачи. Ее определяют как науку о принятии решений в условиях неопределенности

Итак, общая задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.

Иногда проводят сплошное обследование, т.е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяют сравнительно редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование практически не имеет смысла. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.

Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых произвол выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N = 1000, а объем выборки п = 100.

При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В соответствии со сказанным, выборки подразделяют на повторные и бесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.

На практике обычно пользуются бесповторным случайным отбором.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной). Это значит, что следует исключить личные мотивы, иные психологически осмысленные и неосмысленные факторы при отборе объектов. Надо строго соблюдать случайность отбора объектов, обеспечить каждому объекту одинаковую с другими вероятность попадания в выборку.

На практике применяются различные способы отбора. Принципиально эти способы можно подразделить на два вида:

1. Отбор, не требующий расчленения генеральной совокупности на части. Сюда относятся:

а) простой случайный бесповторный отбор;

б) простой случайный повторный отбор.

2. Отбор, при котором генеральная совокупность разбивается на части. Сюда относятся:

а) типический отбор;

б) механический отбор;

в) серийный отбор.

Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности. Осуществить простой отбор можно различными способами. Например, для извлечения п объектов из генеральной совокупности объема N поступают так: выписывают номера от 1 до N на карточках, которые тщательно перемешивают и наугад вынимают одну карточку; объект, имеющий одинаковый номер с извлеченной карточкой, подвергают обследованию, затем карточку возвращают в пачку и процесс повторяют, т.е. карточки перемешивают, наугад вынимают одну из них и т.д. Так поступают п раз, в итоге получают простую случайную повторную выборку объема п.

Если извлеченные карточки не возвращать в пачку, то выборка является простой случайной бесповторной.

Если генеральная совокупность делится на типичные части, к примеру, патроны делятся по калибрам, то отбор производится не из всех патронов, а отдельно по калибрам. Такой отбор называется типическим.

Отбор типа «берется каждый пятый предмет в генеральной совокупности» называется механическим.

Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если изделия изготовляются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.

Подчеркнем, что на практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы. Например, иногда разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.

Генеральная совокупность – множество тех людей, сведения о которых стремится получить социолог в своем исследовании. В зависимости от того, насколько широкой будет тема исследования, настолько же широка будет генеральная совокупность.

Выборочная совокупность – уменьшенная модель генеральной совокупности; те, кому социолог раздает анкеты, кого называют респондентами, кто, наконец, представляет собой объект социологического исследования.

Кого именно относить к генеральной совокупности, определяют цели исследования, а кого включать в выборочную совокупность решают математические методы. Если социолог намеревается взглянуть на афганскую войну глазами ее участников, в генеральную совокупность войдут все воины-афганцы, но опрашивать ему придется небольшую часть – выборочную совокупность. Для того чтобы выборка точно отражала генеральную совокупность, социолог придерживается правила: любой воин-афганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, должен иметь одинаковую вероятность попасть в выборочную совокупность.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки . После чего решается вопрос о типе выборки.

Выборки делятся на три больших класса:

а) сплошные (переписи, референдумы). Опрашиваются все единицы из генеральной совокупности;

б) случайные ;

в) неслучайные.

Случайный и неслучайный типы выборки в свою очередь подразделяются на несколько видов.

К случайным относят:

1) вероятностную;

2) систематическую;

3) районированную (стратифицированную);

4) гнездовую.

К неслучайным относят:

1) «стихийную»;

2) квотную;

3) метод «основного массива».

Полный и точный перечень единиц выборочной совокупности образует основу выборки . Элементы, предназначенные для отбора, называются единицами отбора . Единицы отбора могут совпадать с единицами наблюдения, поскольку единицей наблюдения считается элемент генеральной совокупности, с которого непосредственно ведется сбор информации. Обычно единица наблюдения – это отдельный человек. Отбор из списка лучше всего производить, нумеруя единицы и используя таблицу случайных чисел, хотя часто используется квази-случайный метод, когда из перечня простого берется каждый n-й элемент.

Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группирование по каким-то важным признакам, например, распределение индивидов по профессии, квалификации, полу или возрасту. Если в генеральной совокупности, к примеру, 30% молодежи, 50% людей среднего возраста и 20% пожилых, то и в выборочной совокупности должны соблюдаться те же самые процентные пропорции трех возрастов. К возрастам могут добавиться классы, пол, национальность и т.д. Для каждой устанавливаются процентные пропорции в генеральной и выборочной совокупности. Таким образом, структура выборки – процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.

Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое их количество попало сюда.

Объем выборки – количество единиц выборочной совокупности. Поскольку выборочная совокупность – это часть генеральной совокупности, отобранной с помощью специальных методов, ее объем всегда меньше объема генеральной. Поэтому так важно, чтобы часть не искажала представления о целом, то есть репрезентировала его.

На достоверность данных влияют не количественные характеристики выборочной совокупности (ее объем), а качественные характеристики генеральной совокупности – степень ее однородности. Расхождение между генеральной и выборочной совокупностью называется ошибкой репрезентативности , допустимое отклонение – 5%.

Вот некоторые способы избежать ошибки:

    каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;

    отбор желательно производить из однородных совокупностей;

    надо знать характеристики генеральной совокупности;

    при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (выборка) составлена правильно, то социолог получает надежные результаты, характеризующие всю генеральную совокупность.

Каковы же основные методы выборки ?

Метод механической выборки , когда из общего списка генеральной совокупности через равные промежутки отбирается необходимое число респондентов (например, каждый 10-й).

Метод серийной выборки . При этом генеральная совокупность разбивается на однородные части и из каждой пропорционально отбираются единицы анализа (например, по 20% мужчин и женщин на предприятии).

Метод гнездовой выборки . В качестве единиц отбора выступают не отдельные респонденты, а группы с последующим сплошным исследованием в них. Данная выборка будет представительна, если состав групп схож (например, по одной группе студентов из каждого потока какого-нибудь факультета вуза).

Метод основного массива – опрос 60–70% генеральной совокупности.

Метод квотной выборки . Наиболее сложный метод, требующий определения не менее четырёх признаков, по которым проводится отбор респондентов. Применяется обычно при большой генеральной совокупности.

Всякое каким-то образом выделенное множество объектов, которые могут отличаться друг от друга значением некоторой определенной характеристики, называется генеральной совокупностью.

Число элементов генеральной совокупности называется ее объемом.

Часть генеральной совокупности, случайным образом отобранная для наблюдений, называется случайной выборкой или, для краткости, выборкой.

Число элементов выборки называется ее объемом.

Так, если из ста тысяч упаковок некоторого лекарства (генеральная совокупность) для контроля качества отобрано сто упаковок (выборка), то объем генеральной совокупности составляет 100000, а объем выборки – 100.

Свойства выборочной совокупности тем лучше отражают соответствующие свойства генеральной совокупности, чем больше объектов содержит эта выборочная совокупность (т.е. чем больше ее объем). Например, если интересует концентрация некоторого вещества в таблетках, выпускаемых при помощи аппарата определенной конструкции, то чем больше случайным образом отобранных таблеток мы исследуем, тем более достоверную информацию получим.

Поскольку мы рассчитываем с помощью статистических методов высказать определенное суждение о свойствах генеральной совокупности по свойствам выборки, то последняя должна быть репрезентативной (представительной), т.е. должна быть организована таким образом, чтобы, по возможности, отражать все интересующие нас свойства генеральной совокупности.

Например, при обследовании на предмет успеваемости по физиологии студентов медицинских университетов А, В и С, в которых обучаются 500, 200 и 300 студентов соответственно, выборку объемом 100 следует строить так, чтобы в нее входило 50 случайным образом выбранных студентов университета А, 20 студентов университета В и 30 студентов университета С. Пропорции в выборке должны соответствовать пропорциям генеральной совокупности.

Для обеспечения репрезентативности выборка должна быть достаточно объемной с тем, чтобы охватывать всю генеральную совокупность, и производиться беспристрастно по отношению к отдельным ее частям.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. На практике обычно пользуются бесповторным случайным отбором.

На практике применяются различные способы отбора. Принудительно эти способы можно подразделить на два вида:
I. Отбор, не требующий расчленения генеральной совокупности на части, сюда относятся:
а) простой случайный бесповторный отбор;
б) простой случайный повторный отбор.
II. Отбор, при котором генеральная совокупность разбивается на части, сюда относятся:
а) типический отбор;
б) механический отбор;
в) серийный отбор.

Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности. Если извлеченные карточки не возвращать в пачку, то выборка будет простой случайной бесповторной.

Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части.

Механическим называют отбор, при котором генеральная совокупность «механически» делится на столько групп, сколько объектов должно войти в выборку, и из каждой группы отбирается один объект.
Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию.

Генеральная совокупность – совокупность элементов, удовлетворяющих неким заданным условиям; именуется также изучаемой совокупностью. Генеральная совокупность (Universe) - все множество объектов (субъектов) исследования, из которого выбираются (могут выбираться) объекты (субъекты) для обследования (опроса).

ВЫБОРКА или выборочная совокупность (Sample) - это множество объектов (субъектов), отобранных специальным образом для обследования (опроса). Любые данные, полученные на основании выборочного обследования (опроса), имеют вероятностный характер. На практике это означает, что в ходе исследования определяется не конкретное значение, а интервал, в котором определяемое значение находится.

Характеристики выборки:

Качественная характеристика выборки – что именно мы выбираем и какие способы построения выборки мы для этого используем.

Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки:

Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

Существует необходимость в сборе первичной информации.

Объём выборки - число случаев, включённых в выборочную совокупность.

Зависимые и независимые выборки.

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми .

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми.

Типы выборки.

Выборки делятся на два типа:

Вероятностные;

Не вероятностные;

Репрезентативная выборка - выборочная совокупность, в которой основные характеристики совпадают с характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки - наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

17. Дискретный вариационный ряд, ранжирование, частота, частность.

Вариационным рядом (статистическим рядом) – называется последовательность вариант, записанных в порядке возрастания и соответствующих им весов.

Вариационный ряд может быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).

Дискретный вариационный ряд имеет вид:

Наблюдаемые значения случайной величины х1, х2, …, хk называются вариантами, а изменение этих значений называются варьированием.

Выборка (выборочная совокупность) – совокупность наблюдений, отобранных случайным образом из генеральной совокупности.

Число наблюдений в совокупности называется ее объемом.

N – объем генеральной совокупности.

n – объем выборки(сумма всех частот ряда).

Частотой варианты хi называется число ni (i=1,…,k), показывающее, сколько раз эта варианта встречается в выборке.

Частостью (относительной частотой, долей) варианты хi (i=1,…,k) называется отношение ее частоты ni к объему выборки n.
wi =ni /n

Ранжирование опытных данных - операция, заключающаяся в том, что результаты наблюдений над случайной величиной, т. е. наблюдаемые значения случайной величины, располагают в порядке неубывания.

Дискретным вариационным рядом распределения называется ранжированная совокупность вариантов хi с соответствующими им частотами или частностями.

Множество социальных объектов, явлений, процессов, которые являются предметом изучения социологического исследования, образуют генеральную совокупность . Любую генеральную совокупность характеризует некоторый явно задаваемый признак (или набор признаков), по значению которого всегда можно однозначно определить, относится данный объект к генеральной совокупности или нет.

Часть объектов генеральной совокупности, выступающих в качестве объектов наблюдения, называется выборочной совокупностью .

Иными словами, если генеральная совокупность включает все без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральной совокупности. Выборочная совокупность конструируется таким образом, чтобы при минимуме исследуемых объектов удавалось с необходимой степенью гарантии представить всю генеральную совокупность.

Единицей отбора называют элементы генеральной совокупности, которые выступают единицами счета в различных процедурах отбора, формирующих выборку.

Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются исследованию.

Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора). Единицами отбора могут выступать как отдельные индивиды, так и целые коллективы или целые группы (например, при проведении сплошного опроса).

При совпадении единицы наблюдения с единицей отбора применяется одноступенчатая (простая) выборка, при несовпадении – многоступенчатая (сложная) выборка.

Объем выборки зависит от ряда факторов:

· от цели и задач исследования,

· от степени однородности генеральной совокупности,

· от величины доверительной вероятности,

· от точности результатов (величины допускаемой ошибки репрезентативности).

В таблице 4 приведено соотношение генеральной совокупности и объема выборки.

Таблица 4. Соотношение объемов генеральной и выборочной совокупностей.

Представленная таблица отражает многолетний опыт работы социологов, нередко используется при отсутствии данных о генеральной совокупности, что делает невозможным применение формулы.

Определения объема выборочной совокупности недостаточно для ее изучения. Необходимо определиться с видом выборки.

Различаются выборки вероятностные и целенаправленные .

Модель вероятностной (случайной ) выборки связана с понятием вероятности, широко используемым во многих социальных науках. В самом общем случае вероятность некоторого ожидаемого события есть отношение числа всех возможных событий к числу ожидаемых. При этом общее число событий должно быть достаточно большим (статистически значимым). Кроме этого, необходимо создать условия равновероятности отбора единиц. Условие равновероятности должно гарантировать для каждого элемента генеральной совокупности попасть в выборочную. Такая ситуация возможна при равномерном распределении элементов генеральной совокупности.

Существуют различные методы вероятностной (случайной) выборки:

· метод собственно-случайного отбора,

· случайно-бесповторный метод,

· случайно-повторный,

· метод механической выборки (например, каждый десятый элемент генеральной совокупности включается в выборочную).

Нередко используется довольно точный метод отбора выборочной совокупности - метод серийной выборки. Суть этого метода заключается в расчленении генеральной совокупности на однородные части (серии) по заданному признаку. После этого отбор респондентов осуществляетсяв каждой серии по заданному признаку.

Кроме этого, существует метод гнездовой выборки . «Гнездо» представляет собой группу каких-либо объектов, состоящих из ряда элементов. В качестве единиц исследования используют не отдельных респондентов, а группы, коллективы.

Наряду с вероятностной выборкой в социологических исследованиях применяется также и целенаправленная выборка. Целенаправленная выборка осуществляется не с помощью теории вероятности, а при использовании ряда методов:

· стихийной выборки,

· основного массива,

· квотной выборки.

Стихийная выборка чаще всего применяется в журналистике. Примером стихийной выборки может служить почтовый опрос. Достоверность и качество полученной при этом информации очень низкие и распространяются только на опрошенную совокупность.

Метод основного массива применяется как «зондаж» при проведении пилотажного исследования, при этом изучается 60-70% генеральной совокупности.

Наиболее точным из методов целенаправленных выборок можно считать метод квотной выборки . Однако, применение этого метода возможно при наличии статистических данных о генеральной совокупности. Все данные о признаках генеральной совокупности выступают в качестве квот, а отдельные числовые значения – в качестве параметров квот. При квотной выборке респонденты отбираются целенаправленно с соблюдением параметров квот. В качестве квоты могут выступать не более четырех признаков. Например, пол, возраст, стаж работы, уровень образования и т.д.

Определение объема и вида выборки - недостаточное условие правомерности распространения выводов исследования на всю генеральную совокупность. Из всего многообразия возможных выборочных совокупностей необходимо отобрать одну, наиболее точную. Способность выборки отражать, моделировать значимые свойства генеральной совокупности – есть репрезентативность выборки.

Отклонение результатов выборочного исследования от существенных характеристик генеральной совокупности называется ошибкой репрезентативности .

Ошибки репрезентативности могут быть случайными и систематическими. Случайные ошибки репрезентативности носят вероятностный характер и при повторном измерении изменяются по вероятностным законам. Систематическими ошибками репрезентативности называют ошибки смещения, нарушающие точность выборочной совокупности. Систематические ошибки возникают при просчетах на стадии проектирования выборки, при отсутствии информации о социальном объекте, при неправильном выборочном отборе. Систематические ошибки репрезентативности могут быть также непреднамеренными (например, просчет на стадии проектирования выборки) и преднамеренными (обусловленными идеологическими, экономическими и т.д. факторами).

При исследовании генеральной совокупности выборочный метод значительно облегчает задачу исследователя, однако необходимо помнить о возможных трудностях связанных с методом выборочного исследования.

error: