Примеры решения задач по статистике. Решение задач по математической статистике

В рамках образовательной программы вуза вряд ли встретишь отдельную дисциплину с названием «математическая статистика», однако элементы математической статистики часто изучаются в совокупности с теорией вероятностей , но только после изучения основного курса теории вероятностей.

Математическая статистика: общие сведения

Математическая статистика – это раздел математики, который разрабатывает методы регистрации, описания и анализа данных каких-либо наблюдений и экспериментов, целью которых является построение вероятностных моделей массовых случайных явлений.

Математическая статистика как наука возникла в XVII в. и развивалась параллельным курсом с теорией вероятностей. Большой вклад в развитие науки внесли в XIX-XX вв. Чебышев П.Л., Гаусс К., Колмогоров А.Н. и др.

Общая задача математической статистики заключается в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Основными разделами математической статистики являются:

  • выборочный метод (ознакомление с понятием выборки, способами сбора и обработки данных и т.д.);
  • статистическая оценка параметров выборки (оценки, доверительные интервалы и т.д.);
  • расчет сводных характеристик выборки (расчет вариант, моментов и т.д.);
  • теория корреляции (уравнения регрессии и т.д.);
  • статистическая проверка гипотез;
  • однофакторный дисперсионный анализ.

К наиболее распространенным задачам математической статистики, которые изучаются в вузе и часто встречаются на практике, относятся:

  • задачи определения оценок параметров выборки;
  • задачи на проверку статистических гипотез;
  • задачи определения вида закона распределения по статистическим данным.

Задачи определения оценок параметров выборки

Изучение математической статистики начинается с определения таких понятий как «выборка», «частота», «относительная частота», «эмпирическая функция», «полигон», «кумулята», «гистограмма» и т.д. Далее идет изучение понятий оценок (смещенная и несмещенная): выборочная средняя, дисперсия, исправленная дисперсия и т.д.

Задача

Измерение роста детей младшей группы детского сада представлено выборкой:
92, 96, 95, 96, 94, 97, 98, 94, 95, 96.
Найдем некоторые характеристики этой выборки.

Решение

Размер выборки (число измерений; N ): 10.
Наименьшее значение выборки: 92. Наибольшее значение выборки: 98.
Размах выборки: 98 – 92 = 6.
Запишем ранжированный ряд (варианты в порядке возрастания):
92, 94, 94, 95, 95, 96, 96, 96, 97, 98.
Сгруппируем ряд и запишем в таблицу (каждой варианте поставим в соответствие число ее появлений):

x i 92 94 95 96 97 98 N
n i 1 2 2 3 1 1 10

Вычислим относительные частоты и накопленные частоты, результат запишем в таблицу:

x i 92 94 95 96 97 98 Итого
n i 1 2 2 3 1 1 10
0,1 0,2 0,2 0,3 0,1 0,1 1
Накопленные частоты 1 3 5 8 1 10

Построим полигон частот выборки (отметим на графике варианты по оси ОХ, частоты по оси OY, соединим точки линией).

Выборочную среднюю и дисперсию вычислим по формулам (соответственно):


Можно находить и другие характеристики выборки, но для общего представления вполне достаточно найденных характеристик.

Задачи на проверку статистических гипотез

Задачи, относящиеся к данному типу, сложнее задач предыдущего типа и их решение зачастую более объемно и трудоемко. Прежде чем приступать к решению задач, сначала изучаются понятия статистической гипотезы, нулевой и конкурирующей гипотезы и т.д.

Рассмотрим простейшую задачу данного типа.

Задача

Даны две независимые выборки объема 11 и 14, извлеченные из нормальных совокупностей X, Y. Известны также исправленные дисперсии, равные соответственно 0,75 и 0,4. Необходимо проверить нулевую гипотезу о равенстве генеральных дисперсий при уровне значимости γ =0,05. Конкурирующую гипотезу выбрать по желанию.

Решение

Нулевая гипотеза для нашей задачи записывается следующим образом:

В качестве конкурирующей гипотезы рассмотрим следующую:

Вычислим отношение большей исправленной дисперсии к меньшей и получим наблюдаемое значение критерия:

Так как конкурирующая гипотеза, которую мы выбрали, имеет вид , то критическая область является правосторонней.
По таблице для уровня значимости 0,05 и числам степеней свободы равным 10 (11 – 1 = 10) и 13 (14 – 1 = 13) соответственно найдем критическую точку:

Так как наблюдаемое значение критерия меньше критического значения (1,875<2,67), то нет оснований отвергнуть гипотезу о равенстве генеральных дисперсий. Таким образом, исправленные дисперсии различаются между собой незначимо.

Рассмотренная задача непроста на первый взгляд, но вполне стандартна и решается по шаблону. Друг от друга такие задачи отличаются, как правило, значениями критериев и критической областью.

Более трудоемкими (так как содержат много вычислений, часть из которых сводится в таблицы) являются задачи на проверку гипотезы о типе распределения генеральной совокупности. При решении таких задач используются различные критерии, например, критерий Пирсона.

Задачи определения вида закона распределения по статистическим данным

Данный тип задач относится к разделу, изучающему элементы теории корреляции. Если рассматривать зависимости Y от Х, то тогда можно было бы вспомнить метод наименьших квадратов для определения вида зависимости. Однако в математической статистике все гораздо сложнее и в теории корреляции рассматриваются двумерные величины, значения которых, как правило, задаются в виде таблиц.

x 1 x 1 x n n y
y 1 n 11 n 21 n n1
y 1 n 12 n 22 n n2
y m n 1m n 2m n nm
n x N

Приведем формулировку одной из задач данного раздела.

Задача

Определить выборочное уравнение прямой линии регрессии Y на Х. Данные приведены в корреляционной таблице.

Y X n y
10 20 30 40
5 1 3 4
6 2 1 3
7 3 2 5
8 1 1
n x 1 5 4 3 N =13

Заключение

В заключении отметим, что уровень сложности задач по математической статистике достаточно сильно разнится при переходе от одного типа к другому. Задачи первого типа достаточно просты и не требуют особого понимания теории, можно просто выписать формулы и решить практически любую задачу. Задачи второго и третьего типа немного сложнее и для их успешного решения необходим определенный «багаж знаний» по данной дисциплине.

Приведем список всего из двух книг, но именно эти книги для автора статьи уже давно стали настольными.

  1. Гмурман В.Е. Теория вероятностей и математическая статистика: учебное пособие. – 12-е изд., перераб. – М.: ИД Юрайт, 2010. – 479 с.
  2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2005. – 404 с.

Решение математической статистики на заказ

Желаем удачи в освоении математической статистики. Будут проблемы — обращайтесь . Будем рады помочь!

Инструкция

В первую очередь нужно упорядочить по выбранному признаку совокупность данных, которые требуется проанализировать. Затем полученные группы данных объединить в столбцы таблицы. В ряде случаев данных, необходимых для решения, может не хватать, тогда их требуется вычислить, используя подходящую формулу статистики или математические формулы.

Исходя из поставленной задачи, следует рассчитать искомую закономерность, используя значения нужных рядов. При проведении данного расчета применяются основные формулы статистики: средние, индексы, показатели. Эти формулы с объяснением условных обозначений можно найти в учебниках или в интернете.

Как правило, полученный расчет требуется представить в виде графического изображения. Для этого в программе, в которой идет работа, нужно выделить столбец и выбрать нужное изображение: график либо диаграмму.

На основе проведенных расчетов и графического изображения нужно провести анализ полученных данных, сопоставить их между собой и таким образом найти ответ на вопрос задачи.

Полезный совет

Самым удобным инструментом решения задач по статистике считается программа MC Excel, которая значительно упрощает все операции.

В интернете легко найти образцы решенных задач по статистике которые можно использовать в качестве наглядного примера.

Статистика - это общественная наука, которая занимается разработкой методов и теоретических положений, применяемых в статистической практике. Статистика изучает общественные явления, а также их внутренние особенности и отличия.

Инструкция

Статистика подразделяется на несколько блоков в зависимости от объекта изучения. Общая теорию статистики включает в себя экономическую и социальную статистику. Общая теория разрабатывает методы и принципы статистического исследования общественных явлений.

В задачи экономической статистики входит анализ показателей, отражающих состояние экономики. Экономическая статистика изучает особенности размещения производительных сил и наличие материальных, финансовых и трудовых ресурсов. Социальная статистика создает систему показателей для того, чтобы дать характеристику образу жизни населения, а также различным аспектам социальных отношений.

Статистика занимается сбором информации, ее сопоставлением и интерпретацией. Причем количественная и качественная стороны явления всегда сосуществуют вместе и образуют единое целое. Явления и процессы общественной жизни, которые изучает статистика, находятся в постоянном изменении. Выполняя сбор, анализ и обработку массовых данных об этих изменениях, выявляются статистические закономерности.

Предметом изучения статистики является общественное явление, его динамика и направление развития. Данная наука исследует социально-экономические процессы, которые носят массовый характер, а также изучает определяющие их факторы.

Выделяют три этапа работы со статистическим данными: сбор, группировку и сводку, обработку и анализ. Сбор данных - это массовое научно-организованное наблюдение, с его помощью получают первичную информацию об отдельных фактах изучаемого явления. Группировка и сводка помогают распределить множество факторов на группы и подгруппы. Итоги по каждой из них оформляют в соответствующие таблицы.

Заключительной стадией статистического исследования является анализ, включающий в себя обработку статистических данных, а также интерпретация полученных результатов. На заключительном этапе делают выводы о состоянии изучаемого явления и выявляют закономерности его развития.

Другие общественные науки используют статистику для подтверждения своих теоретических законов. История, экономика, социология и политология пользуются выводами, основанными на статистических исследованиях.

Видео по теме

Источники:

  • redov.ru, Общая теория статистики

Считается, что отцом европейской школы логики был Аристотель. Именно ему принадлежат первые шаги по систематизации и обосновании главных логических законов, а также форм и правил логических построений.

Логика как философская категория в современном понимании зародилась в Греции в VI веке до н. э. Само слово логика означает не что иное, как «наука о правильном мышлении». То есть логика в изначальном понимании в определенной мере формализовала такие понятия, как рассуждение, доказательство и .

Таким образом, изучение логики позволяет овладеть формами, методами и законами правильного мышления, а также способствует выработке рефлексивных навыков и критического восприятия - как собственных, так и чужих суждений.

Кроме этого, логическое мышление позволяет определиться в выработке собственной позиции по различным вопросам также суждений и необходимой аргументации по ним.

Изучение логики как научной дисциплины дает возможность сформировать достаточно широкий круг компетенций исходя из этого, решать целый ряд задач в различных сферах деятельности.

Логика как наука

В качестве учебной дисциплины логика выполняет определенный ряд важнейших функций в образовательном процессе. Она позволяет расширить знания, дает необходимые методы правильного, рационального мышления, помогает привить необходимую дисциплину ума.

За время своего существования как философского понятия и научной дисциплины логика непрерывно развивалась и совершенствовалась, пережив при этом множество методов и подходов.

Зародившись в Древней Греции, она обрела сильнейший импульс в Средние века и свое дальнейшее развитие в эпоху Возрождения, также этот процесс не и сегодня.

В конечном счете изучение законов логики помогает повысить производительность умственных процессов не только в учебной, но и в производственной деятельности.

В качестве учебной дисциплины логика преследует вполне определенные цели в образовательном процессе, такие как научить студента определять и различать важнейшие логические формы, выполнять операции обобщения и ограничения имен, их деления и определения, определять истинность и ложность высказывания, проверять гипотезы, верно ставить вопросы, и многому другому.

Изучение логики помогает приучить человека к определенной культуре мышления, основанной на базе законов логики, что позволит избежать противоречий в рассуждениях и теоретических построениях.

Логика позволяет обосновывать собственную точку зрения, подкрепляя ее серьезной аргументацией, тем самым обеспечивая твердые позиции в научном споре.

Видео по теме

Совет 4: Что такое материаловедение как учебная дисциплина

Материаловедение – одна из самых важных дисциплин для технических специальностей. Так же, как невозможно научиться читать без знания букв, без материаловедения невозможно понять более сложные науки.

Цели материаловедения как учебной дисциплины

Студенты при изучении материаловедения должны научиться понимать строение, физические, химические, магнитные, оптические, термические свойства различных материалов и веществ, из которых они состоят. Они должны понять, как применяются данные знания в практическом плане, а не только в теоретическом. Цель изучения материаловедения стоит в понимании того, какие процессы происходят в веществах, а также, как ими можно управлять и воздействовать на них. Необходимо знать, как меняются физико-химические свойства материалов при внешнем термическом, механическом или химическом воздействии на них. Также очень важно понимать, как эксплуатировать тот или иной материал или строительстве и можно ли его вообще в том или ином конкретном случае использовать. Будущий специалист просто обязан быть компетентным в этих вопросах. Знания, которые приобретает учащийся при изучении материаловедения, могут пригодиться практически в любой отрасли промышленности, при конструировании, а также в ходе решения конкретных технологических проблем.

Междисциплинарный характер

Материаловедение как учебная дисциплина примечательна тем, что она строится на пересечении нескольких других наук. Это такие науки, как математика, химия, физика. Без элементарных знаний в этих областях будет очень проблематично и изучение материаловедения. А без изучения такого курса, как материаловедение, очень сложно будет в дальнейшем постигать азы таких дисциплин, как «Сопротивление материалов», «Техническая механика», «Теоретическая механика», «Детали машин» и множество других.

Значение для науки в целом

Как невозможно двигаться вперед и смотреть в будущее, не зная истории, так и невозможно продвижение в научной сфере и создании новых областей, новых материалов, обладающих особенными, уникальными свойствами, без знаний в области материаловедения. Применение знаний, полученных в ходе изучения материаловедения, получило широкое распространение во многих областях промышленности. Появились новые способы обработки материалов, их переработки. Благодаря этим знаниям возможно создание новых, более дешевых и безопасных, видов производства. Все эти нововведения в науке были бы невозможны без классических знаний материаловедения.

Перед каждой организацией ежедневно встает множество логистических задач. Предмет «логистика» вводится в программу обучения многих специалистов. Решение задач – один из лучших способов закрепления изученного материала. Для решения задач по логистике применяются различные методы, в том числе и из других научных областей.

Вам понадобится

  • - текст задачи;
  • - учебное пособие по логистике;
  • - ручка и бумага;
  • - компьютер с табличным редактором.

Инструкция

Определите метод, который необходимо применить для решения поставленной задачи (чаще всего он указывается в условии задачи ). К математическим методам относятся теория вероятностей, теория случайных процессов, математическая статистика, логика, теория матриц и другие.

Также используются методы теории исследования операций: линейное, нелинейное, динамическое , теория массового обслуживания и управления запасами, теория эффективности, имитационное моделирование и т.д. Применяются и методы технической кибернетики, такие как теория прогнозирования, теория больших систем, теория графов, расписаний, информации, общая теория управления и т.п.

В учебном пособии по логистике вы можете найти теоретические аспекты применения необходимого метода, а также решения задач. Разберите их и используйте для получения ответа на ваше . Кстати, большинство задач можно решить не одним методом, поэтому вы всегда можете проверить правильность рассуждений.

Выполненное на черновике задание после проверки перепишите и оформите в соответствии с требованиями преподавателя. В конце задачи обязательно выделите ответ.

Примечание:

Первым делом нажать «Вид», там поставить Галку на «Схема документа». Это и есть содержание. С помощью этого можно ходить по документу.

Ответственная за выпуск: Курашева Татьяна Александровна

Составители: Борисова Елена Григорьевна (I – 3, 4); Галкин Сергей Алексеевич (I – 5, II – 1); Григорук Наталия Евгеньевна (I – 6); Куликова Наталия Ивановна (I – 2); Курашева Татьяна Александровна (II – 3); Курникова Елена Леонидовна (I – 1, II – 9); Мальцева Галина Александровна (II – 5, 6); Онучак Виктор Александрович (II – 7); Симонова Марина Демьяновна (II – 8); Тарлецкая Лидия Владимировна (II – 2, 3)

Часть I. Общая теория статистики

Тема 1. Сводка и группировка. Статистические таблицы и графики Задачи и решения

Задача 1

На фирме с числом занятых в 50 чел. в ходе статистического наблюдения были получены следующие данные о стаже рабочих и служащих:

    Составьте ранжированный (в порядке возрастания) ряд распределения;

    Постройте дискретный ряд распределения;

    Произведите группировку, образовав 7 групп с равными интервалами;

    Результаты группировки представьте в таблице и проанализируйте их.

Решение

Задача 2

Имеются следующие данные о годовом обороте по 20 магазинам города:

магазина

Розничный товарооборот

(в тыс. у.е.)

Число рабочих мест

На основе этих данных составьте:

    Ряды распределения магазинов:

    1. По размеру товарооборота и количеству магазинов;

      По числу рабочих мест и количеству магазинов;

    Комбинационную таблицу, разбив все магазины на 5 групп по размеру товарооборота, а в сказуемом таблицы выделите 4 подгруппы по числу рабочих мест.

Решение

Задача 3

По итогам исследования затрат времени сотрудников фирмы на дорогу к месту работы имеются следующие данные (в млн.):

    Сгруппируйте данные, образовав четыре группы

    Результаты группировки оформите таблицей

Решение

Задача 4

Сумма продаж 50 филиалов крупного концерна за неделю составили следующие величины в тыс. долл.:

    Составьте ранжированный ряд в порядке возрастания

    Сгруппируйте данные:

    1. Используя интервал равный 2 тыс. долл.

      Используя интервал равный 4 тыс. долл.

    В какой из группировок потеря информации будет большей?

Решение

Задача 5

Располагая данными о динамике мировой торговли, постройте статистическую таблицу.

Мировой импорт составил (в млрд. долл.):

2000г. – 6230, 2001г. – 5995, 2002г. – 6147, 2003г. – 7158, 2004г. – 8741, 2005г. – 9880, 2006г. – 11302

Мировой экспорт характеризовался за соответствующие годы следующими данными (млрд.долл.):

6026, 5824, 7003, 8517, 9676, 11191.

Источник : Monthly Bulletin of Statistics, New York, UN, 2005. №6. P. 114

Решение

Задача 6

Имеются следующие данные о географическом распределении мировой торговли за 2006 год (в млрд.долл.): мировой экспорт – 11191; экспорт стран ЕС – 4503; РФ – 301; Китай – 969; США – 1038; ФРГ – 1126; Япония – 650.

Подсчитайте долю указанных стран в мировой торговле и оформите эти данные в виде таблицы, а также изобразите их графически.

Источник : Monthly Bulletin of Statistics, New York, YN, 2007. №6. P.114, 118, 129, 139, 136.

Решение

Задача 7

Как эксперту кредитного учреждения Вам необходимо составить макет таблицы, дающей представление о количестве предоставленных Вашей организации кредитов за 5 лет. При этом Вы должны отразить сроки предоставления кредитов (долгосрочные, среднесрочные, краткосрочные) и сумму кредитов, как в абсолютном выражении, так и в % к итогам.

Решение

Задача 8

Имеются следующие данные о численности и стаже работы сотрудников организации на начало текущего года:

    Руководители отделов и их заместители со стажем работы

до 3 лет – 6,

до 6 лет – 8,

до 10 лет – 11,

    лет и выше – 5.

    Работники бухгалтерии со стажем работы

до 3 лет – 3,

до 6 лет – 7,

до 10 лет – 12,

10 лет и выше – 12.

    Работники отделов со стажем работы

до 3 лет – 40,

до 6 лет – 26,

до 10 лет – 21,

10 лет и выше – 53.

На основе этих данных постройте статистическую таблицу, в подлежащем которой приведите типологическую группировку; разбейте каждую группу работников на подгруппы по стажу работы.

Решение

Задача 9

По данным о размере жилой площади, приходящейся на 1 человека, по двум районам города в 2006 году произведите перегруппировку, взяв за основу группы семей во 2­ ом районе.

I район

II район

Группы семей по размеру жилплощади, приходящейся на 1 чел. (в м 2)

Доля семей в % к итогу

Группы семей по размеру жилплощади, приходящееся на 1чел. (в м 2)

Доля семей в % к итогу

14 и более

20 и более

Решение

Задача 10

Имеются следующие данные по 2 филиалам фирмы:

Филиал I

Филиал II

Зарплата в у.е.

Число работников (в %)

Зарплата в у.е.

Число работников в (%)

Произведите вторичную группировку данных с целью приведения их к сопоставимому виду, проведите сравнительный анализ результатов.

Решение

Задача 11

Имеются следующие данные о распределении продовольственных магазинов фирмы «Омега» по величине товарооборота за квартал (данные условные):

Группы магазинов по размерам товарооборота (тыс. у.е.)

Количество магазинов

свыше 1100

На основе этих данных произведите вторичную группировку, разбив указанную совокупность магазинов на новые группы:

До 100 тыс. у.е.: 100 – 250; 250 – 400; 400 – 700; 700 – 1000; 1000 тыс.у.е. и выше.

Решение

Задача 12

По данным о рождаемости и смертности в некоторых странах мира постройте линейные графики (в промилле):

Годы

Китай

Япония

Источник : Monthly Bulletin of Statistics, New York, UN, 2007. №6. P. 8, 9, 10, 11; China Statistical Yearbook, 2005, China Statistical Press, 2005. P. 93.

Решение

Задача 13

Товарная структура экспорта РФ в 2005 году характеризовалась следующими данными в (%):

в том числе:

Продовольственные товары и с/х сырьё (кроме текстильного)

Минеральные продукты

Продукция химической пром-ти, каучук

Кожевенное сырьё, пушнина и изделие из них

Древесина и целлюлозно-бумажные изделия

Текстиль, текстильные изделия и обувь

Металлы, драгоценные камни и изделия из них

Машины, оборудование и транспортные средства

Прочие товары

Особый вид средних величин — структурные средние — применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен.
В качестве структурных средних чаще всего используют показатели моды — наиболее часто повторяющегося значения признака — и медианы — величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой — не меньше его.
Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется.
Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:
,
где XMe — нижняя граница медианного интервала;
hMe — его величина;
am/2- половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);
SMe-1 — сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
mMe — число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).
При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интер­вального ряда с равными интервалами величина моды определяется как
,
где ХMo — нижнее значение модального интервала;
mMo — число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);
mMo-1 — то же для интервала, предшествующего модальному;
mMo+1 — то же для интервала, следующего за модальным;
h — величина интервала изменения признака в группах.

Понятие об ошибке выборки. Методы расчета ошибки выборки

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.
После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.
Простая случайная выборка (собственно-случайная) есть отбор единиц из генеральной совокупности путем случайного отбора, но при условии вероятности выбора любой единицы из генеральной совокупности. Отбор проводится методом жеребьевки или по таблице случайных чисел.Типическая (стратифицированная) выборка предполагает разделение неоднородной генеральной совокупности на типологические или районированные группы по какому-либо существенному признаку, после чего из каждой группы производится случайный отбор единиц.
Для серийной (гнездовой) выборки характерно то, что генеральная совокупность первоначально разбивается на определенные равновеликие или неравновеликие серии (единицы внутри серий связаны по определенному признаку), из которых путем случайного отбора отбираются серии и затем внутри отобранных серий проводится сплошное наблюдение.
Механическая выборка представляет собой отбор единиц через равные промежутки (по алфавиту, через временные промежутки, по пространственному способу и т.д.). При проведении механического отбора генеральная совокупность разбивается на равные по численности группы, из которых затем отбирается по одной единице.
Комбинированная выборка основана на сочетании нескольких способов выборки.
Многоступенчатая выборка есть образование внутри генеральной совокупности вначале крупных групп единиц, из которых образуются группы, меньшие по объему, и так до тех пор, пока не будут отобраны те группы или отдельные единицы, которые необходимо исследовать.
Выборочный отбор может быть повторным и бесповторным. При повторном отборе вероятность выбора любой единицы не ограничена. При бесповторном отборе выбранная единица в исходную совокупность не возвращается.
Для отобранных единиц рассчитываются обобщенные показатели (средние или относительные) и в дальнейшем результаты выборочного исследования распространяются на всю генеральную совокупность.
Основной задачей при выборочном исследовании является определение ошибок выборки. Принято различать среднюю и предельную ошибки выборки. Для иллюстрации можно предложить расчет ошибки выборки на примере простого случайного отбора.
Расчет средней ошибки повторной простой случайной выборки производится следующим образом:
cредняя ошибка для средней

cредняя ошибка для доли

Расчет средней ошибки бесповторной случайной выборки:
средняя ошибка для средней

средняя ошибка для доли

Расчет предельной ошибки повторной случайной выборки:

предельная ошибка для доли
где t — коэффициент кратности;
Расчет предельной ошибки бесповторной случайной выборки:
предельная ошибка для средней

предельная ошибка для доли

Следует обратить внимание на то, что под знаком радикала в формулах при бесповторном отборе появляется множитель, где N — численность генеральной совокупности.
Что касается расчета ошибки выборки в других видах выборочного отбора (например, типической и серийной), то необходимо отметить следующее.
Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.

При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:

Серийная выборка, как правило, проводится как бесповторная, и формула ошибки выборки в этом случае имеет вид

где — межсерийная дисперсия; s — число отобранных серий; S — число серий в генеральной совокупности.
Все вышеприведенные формулы применимы для большой выборки. Кроме большой выборки используются так называемые малые выборки (n < 30), которые могут иметь место в случаях нецелесообразности использования больших выборок.
При расчете ошибок малой выборки необходимо учесть два момента:
1) формула средней ошибки имеет вид

2) при определении доверительных интервалов исследуемого показателя в генеральной совокупности или при нахождении вероятности допуска той или иной ошибки необходимо использовать таблицы вероятности Стьюдента, где Р = S (t, n), при этом Р определяется в зависимости от объема выборки и t.
В статистических исследованиях с помощью формулы предельной ошибки можно решать ряд задач.
1. Определять возможные пределы нахождения характеристики генеральной совокупности на основе данных выборки.
Доверительные интервалы для генеральной средней можно установить на основе соотношений

где — генеральная и выборочная средние соответственно; — предельная ошибка выборочной средней.
Доверительные интервалы для генеральной доли устанавливаются на основе соотношений

2. Определять доверительную вероятность, которая означает, что характеристика генеральной совокупности отличается от выборочной на заданную величину.
Доверительная вероятность является функцией от t, где

Доверительная вероятность по величине t определяется по специальной таблице.
3. Определять необходимый объем выборки с помощью допустимой величины ошибки:

Чтобы рассчитать численность п повторной и бесповторной простой случайной выборки, можно использовать следующие формулы:
(для средней при повторном способе);
(для средней при бесповторном способе);
(для доли при повторном способе);
(для доли при бесповторном способе).

Задача 1

Определите индекс покупательской способности рубля, если в текущем году денежные средства на покупку товаров составили 860 млн. руб., денежные средства на оплату услуг 300 млн. руб. В планируемом году денежные средства на покупку товаров возрастут на 15% , денежные средства на оплату услуг увеличатся на 80 млн. рублей, цены на товары возрастут на 70% , ЦЕНЫ НА УСЛУГИ ВОЗРАСТУТ НА 20% Сделайте выводы.

Решение:

Рассчитаем планируемые показатели
Денежные средства на покупку товаров=860*1,15=989 млн. руб.
Денежные средства на оплату услуг=300+80=380 млн. руб.
Сведем все значения в таблицу.

Рассчитаем индекс цен.

Индекс покупательской способности рубля=1/Индекс цен
Индекс покупательской способности рубля=1/1,56=0,64

За счет повышения цены покупательская способность рубля снизилась на 64%.

Задача 2

Рассчитайте среднюю выработку продавца по магазину по показателям:

секция Дневная выработка продавца тыс. руб. товарооборот тыс. руб.
1 3500 18600
2 4210 26000

Решение:
По формуле средней гармонической взвешенной:

Средняя выработка продавца по магазину равна 3878,26 тыс. руб.

Задача 3

Для определения сроков пользования краткосрочным кредитом в коммерческом банке города была проведена 5% случайная бесповторная выборка лицевых счетов, в результате которой получено следующее распределение клиентов по сроку пользования кредитом (таблица 1):

По данным таблицы постройте не менее трёх видов статистических графиков, возможных для этого исследования.

Решение:

1) На основе данных задачи построим гистограмму распределения числа вкладчиков в зависимости от срока пользования кредитом.


Рис. 1. Гистограмма распределения числа вкладчиков

2) На основе данных задачи построим круговую диаграмму, отражающую число вкладчиков, имеющих различные сроки пользования кредитом, в общей их совокупности.


Рис. 2. Круговая диаграмма, отражающая число вкладчиков,
имеющих различные сроки пользования кредитом, в общей численности вкладчиков обследуемой совокупности.

3) На основе данных задачи построим диаграмму фигур-знаков, отражающую распределения числа вкладчиков в зависимости от срока пользования кредитом.
Одна фигура-знак означает число вкладчиков от 10 человек.
Срок пользования кредитом от 30 до 45 дней:
Срок пользования кредитом от 45 до 60 дней:

Срок пользования кредитом от 60 до 75 дней:

Срок пользования кредитом более 75 дней:

Срок пользования кредитом до 30 дней:

Рис. 3. Диаграмма фигур-знаков распределения числа вкладчиков
в зависимости от срока пользования кредитом

Задача 4

В таблице 2 показано распределение рабочих монтажной бригады по уровню квалификации (разрядам).

Табельный номер

Табельный номер

Разряд 2 5 4 6 7 3 7 6 4 6 3 5 4 6 5

Используя данные таблицы 2, выполните задания:

  1. Сгруппируйте рабочих по разрядам, постройте новую группировочную таблицу.
  2. Найдите моду, медиану и средний разряд рабочих данной бригады. Объясните, что означают полученные Вами значения средней величины, моды и медианы в данном исследовании.
  3. Постройте круговую диаграмму распределения рабочих по уровню квалификации.
  4. Найдите, какую долю составляют рабочие каждого разряда в общей численности рабочих бригады.

Решение:

1. Сгруппируем рабочих по разрядам:
Таблица 1

2. Модой (М0) в дискретном ряду распределения называется вариант, имеющий наибольшую частоту.
Варианты (хi) – разряды;
частоты (ni) – число рабочих, имеющих соответствующий разряд
В данном случае М0=4.
Медиана (Ме) – это значения варианта для которого значение накопленной частоты составляет не менее половины от общего числа наблюдений, а для следующего за ним варианта, значение накопленной частоты строго больше половины от общего числа наблюдений.
Рассчитаем накопленные частоты:
Таблица 2


Ме=5
Средний разряд рабочих найдем по формуле средней арифметической взвешенной:


Полученные значения средней величины, моды и медианы означают следующее: в квалификация рабочего монтажной бригады в среднем соответствует разряду уровня 4,6; наибольшее число рабочих в бригаде имеет 4-ый разряд; половина рабочих бригады имеет разряд не выше 5-го и половина – не ниже 5-го разряда.
3. Построим круговую диаграмму распределения рабочих по уровню квалификации.


Рис. 4. Круговая диаграмма распределения рабочих по уровню квалификации
4. Рассчитаем, какую долю составляют рабочие каждого разряда в общей численности рабочих бригады по формуле:

Доля рабочих 2-го разряда в общей численности рабочих бригады составляет:
или 13,3%
Доля рабочих 3-го разряда в общей численности рабочих бригады составляет:
или 6,7%
Доля рабочих 4-го разряда в общей численности рабочих бригады составляет:
или 26,7%
Доля рабочих 5-го разряда в общей численности рабочих бригады составляет:
или 20%
Доля рабочих 6-го разряда в общей численности рабочих бригады составляет:
или 23,3%
Доля рабочих 7-го разряда в общей численности рабочих бригады составляет:
или 10%

Задача 5

В таблице имеются данные об общей численности пенсионеров РФ в исследуемые годы.

Используя данные таблицы 3, выполните задания:

  1. Определите вид статистического ряда, представленного в таблице.
  2. По данным таблицы определите основные показатели динамики.
  3. Определите среднюю численность пенсионеров в исследуемый период. Обоснуйте применённую Вами формулу.
  4. По данным таблицы постройте динамический график численности пенсионеров в исследуемый период.
  5. Постройте парную линейную регрессию численности пенсионеров в исследуемый период.
  6. Используя построенную модель регрессии, сделайте прогноз на 2010 год и сравните с реальной ситуацией. Данные о численности пенсионеров в 2010 году можно найти в СМИ. Не забудьте указать источник информации.

Решение:

1. Статистического ряд, представленный в таблице представляет собой ряд динамики.
2. По данным таблицы определите основные показатели динамики.
Важнейшим статистическим показателем анализа динамики яв­ляется абсолютный прирост (сокращение), т.е. абсолютное изменение, характеризующее увеличение или уменьшение уровня ряда за оп­ределенный промежуток времени. Абсолютный прирост с пере­менной базой называют скоростью роста.
Абсолютные приросты вычисляются по формулам:
(цепной)
(базисный)
где yi - уровень сравниваемого периода; yi-1- уровень предшествующего периода; У0 - уровень базисного периода.
Для оценки интенсивности, т. е. относительного изменения уровня динамического ряда за какой-либо период времени ис­числяют темпы роста (снижения).
Интенсивность изменения уровня оценивается отношением отчетного уровня к базисному.
Показатель интенсивности изменения уровня ряда, выра­женный в долях единицы, называется коэффициентом роста, а в процентах - темпом роста. Эти показатели интенсивности из­менения отличаются только единицами измерения.
Коэффициент роста (снижения) показывает, во сколько раз сравниваемый уровень больше уровня, с которым произ­водится сравнение (если этот коэффициент больше единицы) или какую часть уровня, с которым производится сравнение, составляет сравниваемый уровень (если он меньше единицы). Темп роста всегда представляет собой положительное число.
Коэффициент роста вычисляются по формулам:
(цепной)
(базисный)
Темпы роста:
(цепной)
(базисный)
Темпы прироста:
(цепной)
(базисный)
Абсолютное значение одного процента прироста Ai . Этот показатель служит косвенной мерой базисного уровня. Представляет собой одну сотую часть базисного уровня, но одновременно представляет собой и отношение абсолютного прироста к соответствующему темпу роста.
Данный показатель рассчитывают по формуле


Расчеты показателей оформим в таблице.
Таблица 3

Годы

Численность пенсионеров, тыс. чел.

Абсолютные приросты, тыс. чел.

Коэффициенты роста

Темпы роста, %

Темп прироста, %

Абсолютное содержание 1% прироста, тыс. чел.

3. Определим среднюю численность пенсионеров в исследуемый период. Средний уровень интервального ряда с разностоящими уровнями вычисляется по формуле средней арифметической взвешенной:
Расчеты оформим в таблице:
Таблица 4

№ п/п

Итого

Среднее значение


Уравнение парной линейную регрессии численности пенсионеров определяется формулой:

6. Используя построенную модель регрессии, сделаем прогноз на 2010 год
Данные о численности пенсионеров в 2010 году взяты из статистического сборника «Российский статистический ежегодник» — Стат.сб./Росстат. - М., 2011.
Численность пенсионеров в 2010 году составляла 39706 тыс. чел.
Прогноз численности пенсионеров на основе полученной модели составляет:
(тыс.чел.)
Сравним прогнозные данные с реальной ситуацией: реальная численность пенсионеров в 2010 году превышает численность, полученную при расчете по уравнению парной регрессии, на 2,15% или 834 тыс. чел.

Задача по выборочному наблюдению

Проведено выборочное тестирование студентов факультета по экономическим дисциплинам. Численность факультета 850 студентов, объем выборки, сформированной методом бесповторного отбора — 24 студента. Результаты тестирования приведены в таблице. По этим данным определить выборочные средний балл, дисперсию и стандартное отклонение. Вычислить ошибку выборки, найти границы доверительного интервала, в котором окажется средняя генеральной совокупности с вероятностью 0,866 и 0,997.

№ п/п Оценка (в № п/п Оценка (в № п/п Оценка (в № п/п Оценка (в
баллах) баллах) баллах)
1 112 7 105 13 98 19 95
2 95 8 108 14 95 20 115
3 119 9 110 15 111 21 94
4 98 10 101 16 115 22 105
5 112 11 117 17 130 23 121
6 95 12 99 18 104 24 111


1.5.1. По строительному предприятию города известны следующие данные:

Таблица 1.6

Стаж работы, лет

Выработка продукции, руб.

Построить ряд распределения рабочих по стажу, образовав четыре группы с равными интервалами. Для изучения зависимости между стажем и выработкой рабочих-сдельщиков произведите: 1) группировку рабочих по стажу. Каждую группу охарактеризовать: числом рабочих, средним стажем работы, выработкой продукции всего и в среднем на одного рабочего;

2) комбинационную группировку по двум признакам: стажу работы и выработкой продукции на одного рабочего.

Для построения ряда распределения необходимо вычислить величину интервала группировочного признака (стаж работы):

гдеX max и X min – значение признака; n – число образуемых групп.

Для нашего примера величина интервала будет равна года.

Следовательно, первая группа рабочих будет со стажем 2–6 лет, вторая – 6–10 и т.д. По каждой группе подсчитаем численность рабочих и оформим в табл. 1.7.

Таблица 1.7

Распределение рабочих по стажу работы

№ группы

Группы рабочих
по стажу, лет

Число рабочих,
чел.

Число рабочих
в % к итогу

2–6

30,0

6–10

30,0

В ряду распределения, для наглядности, изучаемый признак исчисляют в процентах. Результаты первичной группировки показали, что 60,0% рабочих имеют стаж до 10 лет, причем поровну от 2–6 лет – 30% и от 6–10 лет – 30%, а 40% рабочих имеют стаж от 10 до 18 лет.

Для изучения зависимости между стажем работы и выработкой необходимо построить аналитическую группировку. В основании ее возьмем те же группы, что в ряду распределения. Результаты группировки представим в табл. 1.8.

Таблица 1.8

Группировка рабочих по стажу работы


группы

Группы
рабочих
по стажу, лет

Число
рабочих, чел.

Средний
стаж работы, лет

Выработка продукции, руб.

на одного раб.

2 –6

3,25

1335,0

222,5

6 –10

7,26

1613,0

268,8

Для заполнения табл. 1.8 необходимо составить рабочую табл. 1.9.

Таблица 1.9

Группы рабочих
по стажу, лет

Номер рабочего

Выработка
в руб.

1, 2, 3, 4, 7, 10

2,0; 2,3; 3,0;
5,0; 4,5; 2,7

205, 200, 205, 250, 225, 250

Итого по группе:

5, 6, 8, 13, 17, 19

6,2; 8,0; 6,9;
7,0; 9,0; 6,5

208, 290, 270, 250, 270, 253

Итого по группе

9, 12, 15, 16, 18

12,5; 13,0; 11,0;
10,5; 12,8

230, 300, 287, 276, 258

Итого по группе

Итого по группе

Разделив графы (4:3); (5:3) табл. 1.9, получим соответствующие данные для заполнения табл. 1.8. И так далее по всем группам. Заполнив табл. 1.8, получим аналитическую таблицу.

Рассчитав рабочую таблицу, сверяем итоговые результаты таблицы с данными условиями задачи, они должны совпадать. Таким образом, кроме построения группировок, нахождения средних величин, проведем еще арифметический контроль.

Анализируя аналитическую таблицу 1.8, можно сделать вывод о том, что и изучаемые признаки (показатели) зависят друг от друга. С ростом стажа работы постоянно увеличивается выработка продукции на одного рабочего. Выработка рабочих четвертой группы на 99,1 руб. выше, чем первой или на 44,5%. м ы рассмотрели пример группировки по одному признаку. Но в ряде случаев для решения поставленных задач эта группировка является недостаточной. В таких случаях переходят к группировке по двум или более признакам, то есть к комбинационной. Произведем вторичную группировку данных по средней выработке продукции. Для построения вторичной аналитической группировки по средней выработке продукции в пределах первоначально созданных групп определим интервал вторичной группировки, выделив при этом три группы, т.е. на одну меньше, чем в первоначальной группировке.

Тогда руб.

Больше групп брать нет смысла, будет очень маленький интервал, меньше – можно. Итоговые данные по группе рассчитываются как сумма стажа по группе, например по первой 19,5 лет делится на число рабочих – 6 человек, получим 3,25 года.

Каждую группу охарактеризуем числом рабочих, средним стажем работы, средней выработкой – всего и на одного рабочего. р асчеты представлены в табл. 1.10.

Таблица 1.10

Группировка рабочих по стажу и средней выработке продукции

№ п/п

Группы рабочих

Число
раб.,
чел.

Сред. стаж
раб., лет

Средняя выработка прод., руб.

по стажу

по сред. выраб. прод. в руб.

всего

на одного раб.

200,0–250,0
250,0–300,0
300,0–350,0

2,5
4,75
-

835,0
500,0
-

208,75
250,0
-

Итого по группе

200,0–250,0
250,0–300,0
300,0–350,0

-
7,26
-

-
1613,0
-

-
268,8
-

200,0–250,0
250,0–300,0
300,0–350,0

12,5
11,43
13,0

230,0
821,0
300,0

230,0
273,6
300,0

Итого по группе2

200,0–250,0
250,0–300,0
300,0–350

-
16,0
16,75

-
295,0
670,0

-
295,0
335,0

Итого по группе

Итого по группам

200,0–250,0
250,0–300,0
300,0–350,0

5
12
3

3,0
9,86
14,87

1065,0
3229,0
970

213,0
269,0
323

Данные таблицы показывают, что выработка продукции находится в прямой зависимости от стажа работы.

Иногда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности, либо для приведения к сопоставимому виду группировок, с целью проведения сравнительного анализа, необходимо имеющуюся группировку несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных типичных групп или изменить границы прежних групп с тем, чтобы сделать группировку сопоставимой с другими.

1.5.2. Имеются данные двух отраслей предприятий о стоимости основных фондов:

Таблица 1.11

1 отрасль

2 отрасль

Группы предприятий
по стоимости основных
фондов в млн руб.

Удельный вес пред. в %

Группы предприятий
по стоимости основных
фондов в млн руб.

Удельный вес пред. в %

До 10
10–12
12–15
15–20
20–30
Свыше 30

10
10
20
30
22
8

До 10
10–15
15–25
25–30
Свыше 30

5
20
40
25
10

Сравните структуру предприятий по стоимости основных фондов.