banner
Центр новостей
Продуктивное сотрудничество приведет к желаемому результату.

Объяснение 4 типов методов случайной выборки

Aug 23, 2023

«Почему меня должна волновать случайная выборка?»

И вот почему: если вы специалист по данным и хотите разрабатывать модели, вам нужны данные. И если вам нужны данные, кто-то должен их собрать. И если кто-то собирает данные, ему необходимо убедиться, что они не являются предвзятыми, иначе это будет стоить чрезвычайно дорого.в долгосрочной перспективе.

Поэтому, если вы хотите собрать объективныеданных, то вам нужно знать о случайной выборке.

Еще от Теренса Шина10. Продвинутые концепции SQL, которые следует знать для интервью по науке о данных

Случайная выборка просто описывает состояние, при котором каждый элемент популяции имеет равные шансы быть выбранным для выборки. Звучит просто, правда? Что ж, это гораздо легче сказать, чем сделать, потому что вам придется учитывать множество вопросов логистики, чтобы свести к минимуму предвзятость. Эти четыре типа методов случайной выборки позволят вам сделать именно это.

Простая случайная выборка требует использования случайно сгенерированных чисел для выбора выборки. Точнее, изначально требуется основа выборки, которая представляет собой список или базу данных всех членов совокупности. Затем вы можете случайным образом сгенерировать число для каждого элемента, например, с помощью Excel, и взять первое n требуемых образцов.

В качестве примера представьте, что таблица справа — это ваша основа выборки. Используя такое программное обеспечение, как Excel, вы можете затем генерировать случайные числа для каждого элемента в основе выборки. Если вам нужен размер выборки в три человека, вы должны взять выборки со случайными числами от одного до трех.

Стратифицированная случайная выборка предполагает деление совокупности на группы со схожими характеристиками и случайную выборку каждой группы.

Этот метод обеспечивает равное представительство различных сегментов населения. В качестве примера представьте, что в школе проводится опрос для определения общей удовлетворенности. Здесь стратифицированная случайная выборка может в равной степени представлять мнения студентов на каждом факультете.

Кластерная выборка начинается с разделения совокупности на группы или кластеры. Что отличает этот метод от стратифицированной выборки, так это то, что каждый кластер должен быть репрезентативным для большей части населения. Затем вы случайным образом выбираете целые кластеры для выборки.

Например, если в школе было пять разных восьмых классов, кластерная случайная выборка означает, что в качестве выборки будет выступать любой класс.

Систематическая случайная выборка — это распространенный метод, при котором вы выбираете каждый k-й элемент. Например, если вы проводите опросы в торговом центре, вы можете опросить каждого сотого посетителя.

Если у вас есть основа выборки, вам нужно разделить размер выборки N на желаемый размер выборки n, чтобы получить порядковый номер k. Затем вы должны выбрать каждый k-й элемент в кадре для создания выборки.

Используя те же диаграммы из первого примера, если бы на этот раз нам нужен размер выборки в два раза, мы бы взяли каждую третью строку в основе выборки.

Подробнее о Data ScienceКак создать поисковую систему с помощью Python и Laravel

Теперь вы должны понимать, что такое случайная выборка и несколько распространенных методов ее проведения. Освоение этой концепции чрезвычайно важно для минимизации предвзятости и создания более качественных моделей.