Математическая статистика для специалистов различных областей. Основы математической статистики Приемы математической статистики

СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ЗАКОНЫ ИХ РАСПРЕДЕЛЕНИЯ.

Случайной называют такую величину, которая принимает значения в зависимости от стечения случайных обстоятельств. Различают дискретные и случайные непрерывные величины.

Дискретной называют величину, если она принимает счетное множество значений. (Пример: число пациентов на приеме у врача, число букв на странице, число молекул в заданном объеме).

Непрерывной называют величину, которая может принимать значения внутри некоторого интервала. (Пример: температура воздуха, масса тела, рост человека и т.д.)

Законом распределения случайной величины называется совокупность возможных значений этой величины и, соответствующих этим значениям, вероятностей (или частот встречаемости).

П р и м е р:

x x 1 x 2 x 3 x 4 ... x n
p р 1 р 2 р 3 р 4 ... p n
x x 1 x 2 x 3 x 4 ... x n
m m 1 m 2 m 3 m 4 ... m n

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН.

Во многих случаях наряду с распределением случайной величины или вместо него информацию об этих величинах могут дать числовые параметры, получившие название числовых характеристик случайной величины . Наиболее употребительные из них:

1 .Математическое ожидание - (среднее значение) случайной величины есть сумма произведений всех возможных ее значений на вероятности этих значений:

2 .Дисперсия случайной величины:


3 .Среднее квадратичное отклонение :

Правило “ТРЕХ СИГМ” - если случайная величина распределена по нормальному закону, то отклонение этой величины от среднего значения по абсолютной величине не превосходит утроенного среднего квадратичного отклонения

ЗАОН ГАУССА – НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ

Часто встречаются величины, распределенные по нормальному закону (закон Гаусса). Главная особенность : он является предельным законом, к которому приближаются другие законы распределения.

Случайная величина распределена по нормальному закону, если ее плотность вероятности имеет вид:



M(X) - математическое ожидание случайной величины;

s - среднее квадратичное отклонение.

Плотность вероятности (функция распределения) показывает, как меняется вероятность, отнесенная к интервалу dx случайной величины, в зависимости от значения самой величины:


ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математическая статистика - раздел прикладной математики, непосредственно примыкающий к теории вероятностей. Основное отличие математической статистики от теории вероятностей состоит в том, что в математической статистике рассматриваются не действия над законами распределения и числовыми характеристиками случайных величин, а приближенные методы отыскания этих законов и числовых характеристик по результатам экспериментов.

Основными понятиями математической статистики являются:

1. Генеральная совокупность;

2. выборка;

3. вариационный ряд;

4. мода;

5. медиана;

6. процентиль,

7. полигон частот,

8. гистограмма.

Генеральная совокупность - большая статистическая совокупность, из которой отбирается часть объектов для исследования

(Пример: все население области, студенты вузов данного города и т.д.)

Выборка (выборочная совокупность) - множество объектов, отобранных из генеральной совокупности.

Вариационный ряд - статистическое распределение, состоящее из вариант (значений случайной величины) и соответствующих им частот.

Пример:

X,кг
m

x - значение случайной величины (масса девочек в возрасте 10 лет);

m - частота встречаемости.

Мода – значение случайной величины, которому соответствует наибольшая частота встречаемости. (В приведенном выше примере моде соответствует значение 24 кг, оно встречается чаще других: m = 20).

Медиана – значение случайной величины, которое делит распределение пополам: половина значений расположена правее медианы, половина (не больше) – левее.

Пример:

1, 1, 1, 1, 1. 1, 2, 2, 2, 3 , 3, 4, 4, 5, 5, 5, 5, 6, 6, 7 , 7, 7, 7, 7, 7, 8, 8, 8, 8, 8 , 8, 9, 9, 9, 10, 10, 10, 10, 10, 10

В примере мы наблюдаем 40 значений случайной величины. Все значения расположены в порядке возрастания с учетом частоты их встречаемости. Видно, что справа от выделенного значения 7 расположены 20 (половина) из 40 значений. Стало быть, 7 – это медиана.

Для характеристики разброса найдем значения, не выше которых оказалось 25 и 75% результатов измерения. Эти величины называются 25-м и 75-м процентилями . Если медиана делит распределение пополам, то 25-й и 75-й процентили отсекают от него по четвертушке. (Саму медиану, кстати, можно считать 50-м процентилем.) Как видно из примера, 25-й и 75-й процентили равны соответственно 3 и 8.

Используют дискретное (точечное) статистическое распределение инепрерывное (интервальное) статистическое распределение.

Для наглядности статистические распределения изображают графически в виде полигона частот или - гистограммы .

Полигон частот - ломаная линия, отрезки которой соединяют точки с координатами (x 1 ,m 1 ), (x 2 ,m 2 ), ..., или для полигона относительных частот – с координатами (x 1 ,р * 1 ), (x 2 ,р * 2 ), ...(Рис.1).


m m i /n f(x)

Рис.1 Рис.2

Гистограмма частот - совокупность смежных прямоугольников, построенных на одной прямой линии (Рис.2), основания прямоугольников одинаковы и равны dx , а высоты равны отношению частоты к dx , или р * к dx (плотность вероятности).

Пример:

х, кг 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4
m

Полигон частот

Отношение относительной частоты к ширине интервала носит название плотности вероятности f(x)=m i / n dx = p* i / dx

Пример построения гистограммы .

Воспользуемся данными предыдущего примера.

1. Расчет количества классовых интервалов

гдеn - число наблюдений. В нашем случае n = 100 . Следовательно:

2. Расчет ширины интервала :

,

3. Составление интервального ряда:

2.7-2.9 2.9-3.1 3.1-3.3 3.3-3.5 3.5-3.7 3.7-3.9 3.9-4.1 4.1-4.3 4.3-4.5
m
f(x) 0.3 0.75 1.25 0.85 0.55 0.6 0.4 0.25 0.05

Гистограмма

1. Основные понятия и определения

статистика выборка совокупность бернулли

Понятие статистики

Статистика, вернее ее методы исследования, широко применяется в различных областях человеческих знаний. Однако, как любая наука, она требует определения предмета ее исследования. В связи с этим различают статистику, занимающуюся изучением социально-экономических явлений, которая относится к циклу общественных наук, и статистику, занимающуюся закономерностями явлений природы, которая относится к наукам естественным.

Авторы большинства современных отечественных вузовских учебников по теории статистики (общей теории статистики) под статистикой понимают предметную общественную науку, т.е. науку, имеющую свои особые предмет и метод познания.

Статистика - общественная наука, которая изучает количественную сторону качественно определенных массовых социально-экономических явлений и процессов, их структуру и распределение, размещение в пространстве, движение во времени, выявляя действующие количественные зависимости, тенденции и закономерности, причем в конкретных условиях места и времени.

Предмет статистики

Статистика как наука исследует не отдельные факты, а массовые социально-экономические явления и процессы, выступающие как множество отдельных факторов, обладающих как индивидуальными, так и общими признаками.

Объект статистического исследования в статистике называют статистической совокупностью.

Статистическая совокупность - это множество единиц, обладающих массовостью, однородностью, определенной целостностью, взаимозависимостью состояния отдельных единиц и наличием вариации.

Например, в качестве особых объектов статистического исследования, т.е. статистических совокупностей, может выступать множество коммерческих банков, зарегистрированных на территории Российской Федерации, множество акционерных обществ, множество граждан какой-либо страны и т.д. Важно помнить, что статистическая совокупность состоит из реально существующих материальных объектов.

Каждый отдельно взятый элемент данного множества называется единицей статистической совокупности.

Единицы статистической совокупности характеризуются общими свойствами, именуемыми в статистике признаками , т.е. под качественной однородностью совокупности понимается сходство единиц (объектов, явлений, процессов) по каким-либо существенным признакам, но различающихся по каким-либо другим признакам.

Единицы совокупности наряду с общими для всех единиц признаками, обусловливающими качественную определенность совокупности, также обладают индивидуальными особенностями и различиями, отличающими их друг от друга, т.е. существует вариация признаков . Она обусловлена различным сочетанием условий, которые определяют развитие элементов множества.

Например, уровень производительности труда работников банка определяется его возрастом, квалификацией, отношением к труду и т.д.

Именно наличие вариации предопределяет необходимость статистики . Вариация признака может отражаться статистическим распределением единиц совокупности.

Статистика как наука изучает, прежде всего, количественную сторону общественных явлений и процессов в конкретных условиях места и времени, т.е. предметом статистики выступают размеры и количественные соотношения социально-экономических явлений, закономерности их связи и развития.

Количественную характеристику статистика выражает через определенного рода числа, которые называются статистическими показателями.

Статистический показатель отражает результат измерения у единиц совокупности и совокупности в целом.

Теоретические основы статистики как науки

Теоретическую основу любой науки, в том числе и статистики, составляют понятия и категории, в совокупности которых выражаются основные принципы данной науки.

Статистические совокупности обладают определенными свойствами, носителями которых выступают единицы совокупности (явления), обладающие определенными признаками. По форме внешнего выражения признаки делятся на атрибутивные (описательные, качественные) и количественные. Атрибутивные (качественные) признаки не поддаются количественному (числовому) выражению.

Количественные признаки можно разделить на дискретные и непрерывные.

Важной категорией статистики является также статистическая закономерность.

Статистическая закономерность - это форма проявления причинной связи, выражающаяся в последовательности, регулярности, повторяемости событий с достаточно высокой степенью вероятности, если причины (условия), порождающие события, не изменяются или изменяются незначительно.

Статистическая закономерность устанавливается на основе анализа массовых данных. Это обусловливает ее взаимосвязь с законом больших чисел.

Сущность закона больших чисел заключается в том, что в числах, суммирующих результат массовых наблюдений, выступают определенные правильности, которые не могут быть обнаружены на небольшом числе факторов. Закон больших чисел порожден свойствами массовых явлений. Тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют силу лишь как массовые тенденции, но не как законы для каждого отдельного, индивидуального случая.

Метод статистики

Статистика как наука выработала приемы и способы изучения массовых общественных явлений, зависящие от особенностей ее предмета и задач, которые ставятся при его изучении. Приемы и способы, с помощью которых статистика изучает свой предмет, образуют статистическую методологию.

Под статистической методологией понимается система приемов, способов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений.

Задача статистического исследования состоит в получении обобщающих характеристик и выявлении закономерностей в общественной жизни в конкретных условиях места и времени, которые проявляются лишь в большой массе явлений через преодоление свойственной ее единичным элементам случайности.

Статистическое исследование состоит из трех стадий:

статистическое наблюдение;

сводка и группировка результатов наблюдения;

анализ полученных обобщающих показателей.

Все три стадии связаны между собой, и на каждой из них используются специальные методы, объясняемые содержанием выполняемой работы.

Понятие о выборочном наблюдении

Статистическая методология исследования массовых явлений различает, как известно, два способа наблюдения в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное.

Под выборочным наблюдением понимается такое несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом.

Выборочное наблюдение ставит перед собой задачу - по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

Выборочный метод позволяет получить необходимые сведения приемлемой точности, когда факторы времени и стоимости делают сплошную разработку нецелесообразной.

Характеристики выборочной и генеральной совокупности

Совокупность отобранных для обследования единиц в статистике принято называть выборочной , а совокупность единиц, из которых производится отбор, - генеральной .

Основные характеристики параметров генеральной и выборочной совокупностей обозначаются определенными символами (табл. 1.1 ).

Таблица 1.1 Символы основных характеристик параметров генеральной и выборочной совокупностей

Характеристика

Генеральная совокупность

Выборочная совокупность

Объем совокупности (численность единиц)

Численность единиц, обладающих обследуемым признаком

Доля единиц, обладающих обследуемым признаком

Средний размер признака

Дисперсия количественного признака

Дисперсия доли

В процессе проведения выборочного наблюдения, как и вообще при анализе данных любого обследования, статистика выделяет два вида ошибок: регистрации и репрезентативности.

Ошибки регистрации могут иметь случайный (непреднамеренный) или систематический (тенденциозный) характер. Их можно избежать при правильной организации и проведении наблюдения.

Ошибки репрезентативности органически присущи выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную.

Избежать ошибок репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем закона больших чисел, эти ошибки можно свести к минимальным значениям, границы которых устанавливаются с достаточно большой точностью;

Ошибка выборочного наблюдения - это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения.

Для среднего значения ошибка будет определяться так:

Где, . (1.1)

Величина называется предельной ошибкой выборки .

Предельная ошибка выборки величина случайная. Исследованию закономерностей случайных ошибок выборки посвящены предельные теоремы закона больших чисел.

Наиболее полно эти закономерности раскрыты в теоремах Л.Л. Чебышева и А.М. Ляпунова.

Теорема П. Л. Чебышева : при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице (т.е. почти с достоверностью), утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым.

В теореме доказано, что величина ошибки не должна превышать.

В свою очередь, величина, выражающая среднее квадратическое отклонение выборочной средней от генеральной средней, зависит от колеблемости признака в генеральной совокупности и числа отобранных единиц.

Эта зависимость выражается формулой

где - средняя ошибка выборки (зависит и от способа производства выборки);

Генеральная дисперсия;

Объем выборочной совокупности.

Нетрудно убедиться, что при отборе большого числа единиц расхождения между средними будут меньше, т.е. существует обратная связь между, средней ошибкой выборки и числом отобранных единиц.

Можно доказать, что увеличение колеблемости признака влечет за собой увеличение среднего квадратического отклонения, а, следовательно, и ошибки.

Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой

Так как величина при достаточно больших близка к, можно приближенно считать, что выборочная дисперсия равна генеральной дисперсии, т.е. .

Следовательно, средняя ошибка выборки показывает , какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель.

А. М. Ляпунов доказал, что распределение выборочных средних (а, следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.

Математически теорему Ляпунова можно записать так:

где - предельная ошибка выборки .

Значения этого интеграла для различных значений коэффициента доверия вычислены и приводятся в специальных математических таблицах.

Например:

t = 1 F (t) = 0.683; t = 1.5 F (t) = 0.866;

t = 2 F (t) = 0.954; t = 2.5 F (t) = 0.988;

t = 3 F (t) = 0.997; t = 3.5 F (t) = 0.999.

Это может быть прочитано так: с вероятностью можно утверждать, что разность между выборочной и генеральной средними не превышает одной величины средней ошибки выборки.

Другими словами, в случаев ошибка репрезентативности не выйдет за пределы и т.д.

Зная выборочную среднюю величину признака и предельную ошибку выборки, можно определить границы (пределы), в которых заключена генеральная средняя:

Теорема Бернулли рассматривает ошибку выборки для альтернативного признака, у которого возможны только два исхода: наличие признака () и отсутствие его (0).

Теорема Бернулли утверждает , что при достаточно большом объеме выборки вероятность расхождения между долей признака в выборочной совокупности () и долей признака в генеральной совокупности () будет стремиться к единице:

т.е. с вероятностью, сколько угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки частость признака (выборочная доля) сколько угодно мало будет отличаться от доли признака (в генеральной совокупности).

Ввиду того, что вероятность расхождения между частостью и долей следует закону нормального распределения, эту вероятность можно найти по функции в зависимости от задаваемой величины.

Средняя ошибка выборки для альтернативного признака определяется по формуле

Поскольку доля признака в выборочной совокупности неизвестна, ее необходимо заменить через долю того же признака в генеральной совокупности, т.е. принять, а дисперсию альтернативного признака принять за.

Тогда средняя, ошибка выборки выразится формулой

Предельная величина разности между частостью и долей называется предельной ошибкой выборки .

О величине предельной ошибки можно судить с некоторой вероятностью, которая зависит от множителя, поскольку.

Зная выборочную долю признака и предельную ошибку выборки, можно определить границы, в которых заключена генеральная доля:

Результаты выборочного статистического исследования во многом зависят от уровня подготовки процесса наблюдения.

Под уровнем подготовки в данном случае подразумевается соблюдение определенных правил и принципов проектирования выборочного обследования. Важнейшим элементом проектирования является составление организационного плана выборочного наблюдения.

В организационный план включаются следующие вопросы:

  • 1. Постановка цели и задачи наблюдения.
  • 2. Определение границ объекта исследования.
  • 3. Отработка программы наблюдения (составление анкеты, опросного листа, формы отчета и т.д.) и разработка ее материалов.
  • 4. Определение процедуры отбора, способа отбора и объема выборки.
  • 5. Подготовка кадров для проведения наблюдения, размножение формуляров, инструктивных документов и др.
  • 6. Расчет выборочных характеристик и определение ошибок выборки.
  • 7. Распространение выборочных данных на всю совокупность.
  • 2. Основные способы формирования выборочной cовокупности

Достоверность рассчитанных по выборочным данным характеристик в значительной степени определяется репрезентативностью выборочной совокупности, которая, в свою очередь, зависит от способа отбора единиц из генеральной совокупности.

По виду различают индивидуальный, групповой и комбинированный отбор.

При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе - группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора.

Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора.

Бесповторным называется такой отбор, при котором попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор.

При повторном отборе попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную (генеральную) совокупность для участия в дальнейшей процедуре отбора.

При этом методе объем генеральной совокупности остается неизменным, что обусловливает постоянную вероятность попадания в выборку всех единиц совокупности.

В практике выборочных обследований наибольшее распространение получи ли следующие выборки:

собственно-случайная;

механическая;

типическая;

серийная;

комбинированная.

Собственно-случайная выборка

При такой выборке отбор единиц из генеральной совокупности производится наугад или наудачу, без каких-либо элементов системности. При этом все без исключения единицы генеральной совокупности должны иметь абсолютно равные шансы попадания в выборку.

Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел.

Собственно-случайный отбор может быть как повторным, так и бесповторным.

Предположим, в результате выборочного обследования жилищных условий жителей города, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 2.1 ).

Таблица 2.1 Результаты выборочного обследования жилищных условий жителей города

Для определения средней ошибки выборки необходимо рассчитать выборочную среднюю величину и дисперсию изучаемого признака (т. 2.2).

Таблица 2.2 Расчет средней общей (полезной) площади жилищ, приходящейся на 1 человека, и дисперсии

Общая (полезная) площадь жилищ, приходится на 1 чел, м 2

Число жителей f

Середина интервала x

  • 5,0-10,0
  • 10,0-15,0
  • 15,0-20,0
  • 20,0-25,0
  • 25,0-30,0
  • 30,0 и более
  • 712,5
  • 2550,0
  • 4725,0
  • 4725,0
  • 3575,0
  • 2697,5
  • 5343,75
  • 31875,0
  • 82687,5
  • 106312,5
  • 98312,5
  • 87668,75

Средняя ошибка выборки составит:

Определим предельную ошибку выборки с вероятностью:

Установим границы генеральной средней:

Таким образом, на основании проведенного выборочного обследования с вероятностью можно заключить, что средний размер общей площади, приходящейся на одного человека, в целом по городу лежит в пределах от до.

При расчете средней ошибки собственно-случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора:

Если предположить, что представленные в табл. 2.1 данные являются результатом бесповторного отбора (генеральная совокупность включает единиц), то средняя ошибка выборки будет несколько меньше:

Соответственно уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней.

Воспользуемся еще раз данными табл. 2.1 для того, чтобы определить границы доли лиц, обеспеченность жильем которых составляет менее.

Согласно результатам обследования, численность таких лиц составила человека.

Определим выборочную долю и дисперсию:

Рассчитаем среднюю ошибку выборки:

Предельная ошибка выборки с заданной вероятностью составит:

Определим границы генеральной доли:

Следовательно, с вероятностью можно утверждать, что доля лиц, имеющих менее на человека, в целом по городу находится в пределах от до.

Механическая выборка

Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в расположении единиц (списки избирателей, телефонные номера респондентов, номера домов и квартир и т.п.).

Для проведения механической выборки устанавливается пропорция отбора, которая определяется соотнесением объемов выборочной и генеральной совокупностей.

Отбор единиц осуществляется в соответствии с установленной пропорцией через равные интервалы. Например, при пропорции (выборка) отбирается каждая единица.

Генеральную совокупность при механическом отборе можно ранжировать или упорядочить по величине изучаемого или коррелирующего с ним признака, что позволит повысить репрезентативность выборки.

Однако в этом случае возрастает опасность систематической ошибки, связанной с занижением значения изучаемого признака (если из каждого интервала регистрируется первое значение) или его завышением (если из каждого интервала регистрируется последнее значение).

Целесообразно отбор начинать с середины первого интервала, например при выборке отобрать и с таким же интервалом последующие единицы

Для определения средней ошибки механической выборки используется формула средней ошибки при собственно-случайном бесповторном отборе.

Типический отбор

Этот способ отбора используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько типических групп.

Типический отбор предполагает выборку единиц из каждой типической группы собственно-случайным или механическим способом.

Отбор единиц в типическую выборку может быть организован либо пропорционально объему типических групп, либо пропорционально внутригрупповой дифференциации признака.

При выборке, пропорциональной объему типических групп, число единиц, подлежащих отбору из каждой группы, определяется следующим образом:

где - объем группы;

Объем выборки из группы.

Средняя ошибка такой выборки находится по формулам:

- (повторный отбор); (2.1)

- (бесповторный отбор), (2.2)

где - средняя из внутригрупповых дисперсий.

При выборке, пропорциональной дифференциации признака, число наблюдений по каждой группе рассчитывается по формуле:

где - среднее квадратическое отклонение признака в группе.

Средняя ошибка такого отбора определяется следующим образом:

- (повторный отбор), (2.4)

- (бесповторный отбор). (2.5)

Рассмотрим оба варианта типической выборки на условном примере.

Предположим, бесповторный типический отбор рабочих предприятия, пропорциональный размерам цехов, проведенный с целью оценки потерь из-за временной нетрудоспособности привел к следующим результатам (табл. 2.3 ).

Таблица 2.3 Результаты обследования рабочих предприятия

Определим среднюю и предельную ошибки выборки (с вероятностью):

Рассчитаем выборочную среднюю:

С вероятностью можно сделать вывод, что среднее число дней временной нетрудоспособности одного рабочего в целом по предприятию находится в пределах:

Воспользуемся полученными внутригрупповыми дисперсиями для проведения отбора, пропорционального дифференциации признака.

Определим необходимый объем выборки по каждому цеху:

С учетом полученных значений рассчитаем среднюю ошибку выборки:

В данном случае средняя, а, следовательно, и предельная ошибки будут несколько меньше, что отразится и на границах генеральной средней.

Серийный отбор

Данный способ отбора удобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. В качестве таких серий могут рассматриваться упаковки с определенным количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения.

Сущность серийной выборки заключается в собственно случайном либо механическом отборе серий, внутри который производится сплошное обследование единиц.

Средняя ошибка серийной выборки (при отборе равновеликих серий) зависит от величины только межгрупповой (межсерийной) дисперсии и определяется по следующим формулам:

(повторный отбор); (2.6)

(бесповторный отбор), (2.7)

где - число отобранных серий;

Общее число серий.

Межгрупповую дисперсию вычисляют следующим образом:

где - средняя серии;

Общая средняя по всей выборочной совокупности.

Комбинированный отбор

В практике статистических обследований помимо рассмотренных выше способов отбора применяется и их комбинация.

Можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и собственно-случайного отборов, при которой отдельное единицы отбираются внутри серии в собственно-случайном порядке.

Ошибка такой выборки определяется ступенчатостью отбора.

Многоступенчатым называется отбор, при котором из генеральной совокупности сначала извлекаются укрупненные группы, потом - более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

Многофазная выборка предполагает сохранение одной и той же единицы отбора на всех этапах его проведения, при этом отобранные на каждой стадии единицы подвергаются обследованию (на каждой последующей стадии отбора программа обследования расширяется).

Исходя из вышеизложенного, приведем формулы предельной ошибки выборки для наиболее часто используемых на практике способов формирования выборочной совокупности (табл. 2.4 ).

Таблица 2.4 Предельная ошибка выборки для некоторых способов формирования выборочной совокупности

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

Математическая статистика -- наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей позволяющую оценить надежность и точность выводов делаемых на основании ограниченного статистического материала (напр. оценить необходимый объем выборки для получения результатов требуемой точности при выборочном обследовании).

В теории вероятностей рассматриваются случайные величины с заданным распределением или случайные эксперименты свойства которых целиком известны. Предмет теории вероятностей -- свойства и взаимосвязи этих величин (распределений).

Но часто эксперимент представляет собой черный ящик выдающий лишь некие результаты по которым требуется сделать вывод о свойствах самого эксперимента. Наблюдатель имеет набор числовых (или их можно сделать числовыми) результатов полученных повторением одного и того же случайного эксперимента в одинаковых условиях.

При этом возникают например следующие вопросы: Если мы наблюдаем одну случайную величину -- как по набору ее значений в нескольких опытах сделать как можно более точный вывод о ее распределении? математический статистика дисперсия гистограмма

Примером такой серии экспериментов может служить социологический опрос набор экономических показателей или наконец последовательность гербов и решек при тысячекратном подбрасывании монеты. Все вышеприведенные факторы обуславливают актуальность и значимость тематики работы на современном этапе направленной на глубокое и всестороннее изучение основных понятий математической статистики.

1. Предмет и метод математической статистики

В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел многомерный статистический анализ анализ функций (процессов) и временных рядов статистику объектов нечисловой природы. Существенная часть статистики математической основана на вероятностных моделях. Выделяют общие задачи описания данных оценивания и проверки гипотез. Рассматривают и более частные задачи связанные с проведением выборочных обследований восстановлением зависимостей построением и использованием классификаций (типологий) и др.

Для описания данных строят таблицы диаграммы иные наглядные представления например корреляционные поля. Вероятностные модели обычно не применяются. Некоторые методы описания данных опираются на продвинутую теорию и возможности современных компьютеров. К ним относятся в частности кластер-анализ нацеленный на выделение групп объектов похожих друг на друга и многомерное шкалирование позволяющее наглядно представить объекты на плоскости в наименьшей степени исказив расстояния между ними.

Методы оценивания и проверки гипотез опираются на вероятностные модели порождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается что изучаемые объекты описываются функциями распределения зависящими от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения предполагаются произвольными непрерывными. В статистике математической оценивают параметры и характеристики распределения (математическое ожидание медиану дисперсию квантили и др.) плотности и функции распределения зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции а также параметрических или непараметрических оценок функций выражающих зависимости) и др. Используют точечные и интервальные (дающие границы для истинных значений) оценки.

В математической статистике есть общая теория проверки гипотез и большое число методов посвященных проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик о проверке однородности (то есть о совпадении характеристик или функций распределения в двух выборках) о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций о симметрии распределения и др.

Большое значение имеет раздел математической статистики связанный с проведением выборочных обследований со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.

Задачи восстановления зависимостей активно изучаются более 200 лет с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В настоящее время наиболее актуальны методы поиска информативного подмножества переменных и непараметрические методы.

Разработка методов аппроксимации данных и сокращения размерности описания была начата более 100 лет назад когда К. Пирсон создал метод главных компонент. Позднее были разработаны факторный анализ и многочисленные нелинейные обобщения.

Различные методы построения (кластер-анализ) анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без) автоматической классификации и др.

Математические методы в статистике основаны либо на использовании сумм (на основе Центральной Предельной Теоремы теории вероятностей) или показателей различия (расстояний метрик) как в статистике объектов нечисловой природы. Строго обоснованы обычно лишь асимптотические результаты. В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчетов так и для имитационного моделирования (в частности в методах размножения выборок и при изучении пригодности асимптотических результатов).

1.1 Основные понятия математической статистики

Исключительно важную роль в анализе многих психолого-педагогических явлений играют средние величины, представляющие собой обобщенную характеристи ку качественно однородной совокупности по определенному количественно му признаку. Нельзя, например, вычислить среднюю специальность или среднюю национальность студентов вуза, так как это качест венно разнородные явления. Зато можно и нужно определить в среднем числовую характеристику их успеваемости (средний балл), эффек тивности методических систем и приемов и т. д.

В психолого-педагогических исследованиях обычно применяются различные виды средних величин: средняя арифметическая, сред няя геометрическая, медиана, мода и другие. Наиболее распространенными являются средняя арифметическая, медиана и мода.

Средняя арифметическая применяется в тех случаях, когда между определяю щим свойством и данным признаком имеется прямо пропорциональная зави симость (например, при улучшении показателей работы учебной группы улучшаются показатели работы каждого ее члена).

Средняя арифметическая представляет собой частное от деления сум мы величин на их число и вычисляется по формуле:

Размещено на http://www.allbest.ru/

где Х - средняя арифметическая; X1, X2, Х3 ... Хn - результаты отдельных наблюдений (приемов, действий),

n - количество наблюдений (приемов, действий),

Сумма результатов всех наблюдений (приемов, действий).

Медианой (Ме) называется мера среднего положения, характеризующая значение признака на упорядоченной (построенной по признаку возрастания или убывания) шкале, которое соответствует середине исследуемой совокупности. Медиана может быть определена для порядковых и количественных признаков. Место расположения этого значения определяется по формуле:

Место медианы = (n + 1) / 2

Например. По результатам исследования установлено, что:

На “отлично” учатся - 5 человек из участвующих в эксперименте;

На “хорошо” учатся - 18 человек;

На “удовлетворительно” - 22 человека;

На “неудовлетворительно” - 6 человек.

Так как всего в эксперименте принимало участие N = 54 человека, то середина выборки равна человек. Отсюда делается вывод, что больше половины обучающихся учатся ниже оценки “хорошо”, то есть медиана больше “удовлетворительно”, но меньше “хорошо”.

Мода (Мо) - наиболее часто встречающееся типичное значение признака среди других значений. Она соответствует классу с максимальной частотой. Этот класс называется модальным значением.

Например.

Если на вопрос анкеты: “укажите степень владения иностранным языком”, ответы распределились:

1 - владею свободно - 25

2 - владею в достаточной степени для общения - 54

3 - владею, но испытываю трудности при общении - 253

4 - понимаю с трудом - 173

5 - не владею - 28

Очевидно, что наиболее типичным значением здесь является - “владею, но испытываю трудности при общении”, которое и будет модальным. Таким образом, мода равна - 253.

Важное значение при использовании в психолого-педагогическом исследовании математических методов уделяется расчету дисперсии и среднеквадратических (стандартных) отклонений.

Дисперсия равна среднему квадрату отклонений значения варианты от среднего значения. Она выступает как одна из характеристик индивидуальных результатов разброса значений исследуемой переменной (например, оценок учащихся) вокруг среднего значения. Вычисление дисперсии осуществляется путем определения: отклонения от среднего значения; квадрата указанного отклонения; суммы квадратов отклонения и среднего значения квадрата отклонения.

Значение дисперсии используется в различных статистических расчетах, но не имеет непосредственного наблюдаемого характера. Величиной, непосредственно связанной с содержанием наблюдаемой переменной, является среднее квадратическое отклонение.

Среднее квадратичное отклонение подтверждает типичность и показательность средней арифметической, отражает меру колебания численных значений признаков, из которых выводится средняя величина. Оно равно корню квадратному из дисперсии и определяется по формуле:

(2)Размещено на http://www.allbest.ru/

где: - средняя квадратическая. При малом числе наблюдения (действий) - менее 100 - в значении формулы следует ставить не “N”, а “N - 1”.

Средняя арифметическая и средняя квадратическая являются основны ми характеристиками полученных результатов в ходе исследования. Они позволяют обобщить данные, сравнить их, установить преимущества одной психолого-педагогической системы (программы) над другой.

Среднее квадратическое (стандартное) отклонение широко применяется как мера разброса для различных характеристик.

Оценивая результаты исследования важно определить рассеивание случайной величины около среднего значения. Это рассеивание описывается с помощью закона Гауса (закона нормального распределения вероятности случайной величины). Суть закона заключается в том, что при измерении некоторого признака в данной совокупности элементов всегда имеют место отклонения в обе стороны от нормы вследствие множества неконтролируемых причин, при этом, чем больше отклонения, тем реже они встречаются.

При дальнейшей обработке данных могут быть выявлены: коэффициент вариации (устойчивости) исследуемого явления, представляющий собой процентное отношение среднеквадратического отклонения к средней ариф метической; мера косости, показывающая, в какую сторону направлено преимущественное число отклонений; мера крутости, которая показывает степень скопления значений случайной величины около среднего и др. Все эти статистические данные помогают более полно выявить признаки изучаемых явлений.

Меры связи между переменными. Связи (зависимости) между двумя и более переменными в статистике называют корреляцией. Она оценивается с помощью значения коэффициента корреляции, который является мерой степени и величины этой связи.

Коэффициентов корреляции много. Рассмотрим лишь часть из них, которые учитывают наличие линейной связи между переменными. Их выбор зависит от шкал измерения переменных, зависимость между которыми необходимо оценить. Наиболее часто в психологии и педагогике применяются коэффициенты Пирсона и Спирмена.

1.2 Основные понятия выборочного метода

Пусть -- случайная величина наблюдаемая в случайном эксперименте. Предполагается что вероятностное пространство задано (и не будет нас интересовать).

Будем считать что проведя раз этот эксперимент в одинаковых условиях мы получили числа -- значения этой случайной величины в первом втором и т.д. экспериментах. Случайная величина имеет некоторое распределение которое нам частично или полностью неизвестно.

Рассмотрим подробнее набор называемый выборкой.

В серии уже произведенных экспериментов выборка -- это набор чисел. Но если эту серию экспериментов повторить еще раз то вместо этого набора мы получим новый набор чисел. Вместо числа появится другое число -- одно из значений случайной величины. То есть (и и и т.д.) -- переменная величина которая может принимать те же значения что и случайная величина и так же часто (с теми же вероятностями). Поэтому до опыта -- случайная величина одинаково распределенная с а после опыта -- число которое мы наблюдаем в данном первом эксперименте т.е. одно из возможных значений случайной величины.

Выборка объема -- это набор из независимых и одинаково распределенных случайных величин («копий ») имеющих как и распределение.

Что значит «по выборке сделать вывод о распределении»? Распределение характеризуется функцией распределения плотностью или таблицей набором числовых характеристик -- и т.д. По выборке нужно уметь строить приближения для всех этих характеристик.

1.3 Выборочное распределение

Рассмотрим реализацию выборки на одном элементарном исходе -- набор чисел. На подходящем вероятностном пространстве введем случайную величину принимающую значения с вероятностями по (если какие-то из значений совпали сложим вероятности соответствующее число раз).

Распределение величины называют эмпирическим или выборочным распределением. Вычислим математическое ожидание и дисперсию величины и введем обозначения для этих величин:

Точно так же вычислим и момент порядка

В общем случае обозначим через величину

Если при построении всех введенных нами характеристик считать выборку набором случайных величин то и сами эти характеристики -- -- станут величинами случайными. Эти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения.

Причина использования характеристик распределения для оценки характеристик истинного распределения (или) -- в близости этих распределений при больших.

Рассмотрим для примера подбрасываний правильного кубика. Пусть -- количество очков выпавших при -м броске. Предположим что единица в выборке встретится раз двойка -- раз и т.д. Тогда случайная величина будет принимать значения 1 6 с вероятностями соответственно. Но эти пропорции с ростом приближаются к согласно закону больших чисел. То есть распределение величины в некотором смысле сближается с истинным распределением числа очков выпадающих при подбрасывании правильного кубика.

1.4 Эмпирическая функция распределения гистограмма

Поскольку неизвестное распределение можно описать например его функцией распределения построим по выборке «оценку» для этой функции.

Определение 1. Эмпирической функцией распределения построенной по выборке объема называется случайная функция при каждом равная

Напоминание: Случайная функция

называется индикатором события. При каждом это -- случайная величина имеющая распределение Бернулли с параметром

Иначе говоря, при любом значение равное истинной вероятности случайной величине быть меньше оценивается долей элементов выборки меньших.

Если элементы выборки упорядочить по возрастанию (на каждом элементарном исходе) получится новый набор случайных величин называемый вариационным рядом:

Элемент называется -м членом вариационного ряда или -й порядковой статистикой.

Эмпирическая функция распределения имеет скачки в точках выборки величина скачка в точке равна где -- количество элементов выборки совпадающих с.

Можно построить эмпирическую функцию распределения по вариационному ряду:

Другой характеристикой распределения является таблица (для дискретных распределений) или плотность (для абсолютно непрерывных). Эмпирическим или выборочным аналогом таблицы или плотности является так называемая гистограмма. Гистограмма строится по группированным данным. Предполагаемую область значений случайной величины (или область выборочных данных) делят независимо от выборки на некоторое количество интервалов (не обязательно одинаковых). Пусть -- интервалы на прямой называемые интервалами группировки. Обозначим для через число элементов выборки попавших в интервал:

На каждом из интервалов строят прямоугольник площадь которого пропорциональна. Общая площадь всех прямоугольников должна равняться единице. Пусть -- длина интервала. Высота прямоугольника над равна

Полученная фигура называется гистограммой.

Разобьем отрезок на 4 равных отрезка. В отрезок попали 4 элемента выборки в -- 6 в -- 3 и в отрезок попали 2 элемента выборки. Строим гистограмму (рис. 2). На рис. 3 -- тоже гистограмма для той же выборки но при разбиении области на 5 равных отрезков.

В курсе «Эконометрика» утверждается, что наилучшим числом интервалов группировки («формула Стерджесса») является

Здесь -- десятичный логарифм, поэтому

т.е. при увеличении выборки вдвое число интервалов группировки увеличивается на 1. Заметим что чем больше интервалов группировки, тем лучше. Но если брать число интервалов скажем порядка,то с ростом гистограмма не будет приближаться к плотности.

Справедливо следующее утверждение:

Если плотность распределения элементов выборки является непрерывной функцией, то при так что имеет место поточечная сходимость по вероятности гистограммы к плотности.

Так что выбор логарифма разумен, но не является единственно возможным.

Размещено на Allbest.ru

...

Подобные документы

    Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа , добавлен 28.09.2011

    Предмет, методы и понятия математической статистики, ее взаимосвязь с теорией вероятности. Основные понятия выборочного метода. Характеристика эмпирической функции распределения. Понятие гистограммы, принцип ее построения. Выборочное распределение.

    учебное пособие , добавлен 24.04.2009

    Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция , добавлен 12.12.2011

    Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат , добавлен 01.01.2011

    Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа , добавлен 20.02.2011

    Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.

    курсовая работа , добавлен 13.10.2009

    Статистическая обработка данных контроля времени (в часах) работы компьютерного класса в день. Полигон абсолютных частот. Построение графика эмпирической функции распределения и огибающей гистограммы. Теоретическое распределение генеральной совокупности.

    контрольная работа , добавлен 23.08.2015

    Обработка результатов информации по транспортным и технологическим машинам методом математической статистики. Определение интегральной функции нормального распределения, функции закона Вейбула. Определение величины сдвига к началу распределения параметра.

    контрольная работа , добавлен 05.03.2017

    Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа , добавлен 13.12.2014

    Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

Методы математической статистики


1. Введение

Математической статистикой называется наука, занимающаяся разработкой методов получения, описания и обработки опытных данных с целью изучения закономерностей случайных массовых явлений.

В математической статистике можно выделить два направления: описательную статистику и индуктивную статистику (статистический вывод). Описательная статистика занимается накоплением, систематизацией и представлением опытных данных в удобной форме. Индуктивная статистика на основе этих данных позволяет сделать определенные выводы относительно объектов, о которых собраны данные, или оценки их параметров.

Типичными направлениями математической статистики являются:

1) теория выборок;

2) теория оценок;

3) проверка статистических гипотез;

4) регрессионный анализ;

5) дисперсионный анализ.

В основе математической статистики лежит ряд исходных понятий без которых невозможно изучение современных методов обработки опытных данных. В ряд первых из них можно поставить понятие генеральной совокупности и выборки.

При массовом промышленном производстве часто нужно без проверки каждого выпускаемого изделия установить, соответствует ли качество продукции стандартам. Так как количество выпускаемой продукции очень велико или проверка продукции связана с приведением ее в негодность, то проверяется небольшое количество изделий. На основе этой проверки нужно дать заключение о всей серии изделий. Конечно нельзя утверждать, что все транзисторы из партии в 1 млн. штук годны или негодны, проверив один из них. С другой стороны, поскольку процесс отбора образцов для испытаний и сами испытания могут оказаться длительными по времени и привести к большим затратам, то объем проверки изделий должен быть таким, чтобы он смог дать достоверное представление о всей партии изделий, будучи минимальных размеров. С этой целью введем ряд понятий.

Вся совокупность изучаемых объектов или экспериментальных данных называется генеральной совокупностью. Будем обозначать через N число объектов или количество данных, составляющих генеральную совокупность. Величину N называют объемом генеральной совокупности. Если N>>1, то есть N очень велико, то обычно считают N = ¥.

Случайной выборкой или просто выборкой называют часть генеральной совокупности, наугад отобранную из нее. Слово "наугад" означает, что вероятности выбора любого объекта из генеральной совокупности одинакова. Это важное предположение, однако, часто трудно это проверить на практике.

Объемом выборки называют число объектов или количество данных, составляющих выборку, и обозначают n . В дальнейшем будем считать, что элементам выборки можно приписать соответственно числовые значения х 1 , х 2 , ... х n . Например, в процессе контроля качества производимых биполярных транзисторов это могут быть измерения их коэффициента усиления по постоянному току.


2. Числовые характеристики выборки

2.1 Выборочное среднее

Для конкретной выборки объема n ее выборочное среднее

определяется соотношением

где х i – значение элементов выборки. Обычно требуется описать статистические свойства произвольных случайных выборок, а не одной из них. Это значит, что рассматривается математическая модель, которая предполагает достаточно большое количество выборок объема n. В этом случае элементы выборки рассматриваются как случайные величины Х i , принимающие значения х i с плотностью вероятностей f(x), являющейся плотностью вероятностей генеральной совокупности. Тогда выборочное среднее также является случайной величиной

равной

Как и ранее будем обозначать случайные величины прописными буквами, а значения случайных величин – строчными.

Среднее значение генеральной совокупности, из которой производится выборка, будем называть генеральным средним и обозначать m x . Можно ожидать, что если объем выборки значителен, то выборочное среднее не будет заметно отличаться от генерального среднего. Поскольку выборочное среднее является случайной величиной, для нее можно найти математическое ожидание:

Таким образом, математическое ожидание выборочного среднего равно генеральному среднему. В этом случае говорят, что выборочное среднее является несмещенной оценкой генерального среднего. В дальнейшем мы вернемся к этому термину. Так как выборочное среднее является случайной величиной, флуктуирующей вокруг генерального среднего, то желательно оценить эту флуктуацию с помощью дисперсии выборочного среднего. Рассмотрим выборку, объем которой n значительно меньше объема генеральной совокупности N (n << N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

Случайные величины Х i и X j (i¹j) можно считать независимыми, следовательно,

Подставим полученный результат в формулу для дисперсии:

где s 2 – дисперсия генеральной совокупности.

Из этой формулы следует, что с увеличением объема выборки флуктуации среднего выборочного около среднего генерального уменьшаются как s 2 /n. Проиллюстрируем сказанное примером. Пусть имеется случайный сигнал с математическим ожиданием и дисперсией соответственно равными m x = 10, s 2 = 9.

Отсчеты сигнала берутся в равноотстоящие моменты времени t 1 , t 2 , ... ,

X(t)

X 1

t 1 t 2 . . . t n t

Так как отсчеты являются случайными величинами, то будем их обозначать X(t 1), X(t 2), . . . , X(t n).

Определим количество отсчетов, чтобы среднее квадратическое отклонение оценки математического ожидания сигнала не превысило 1% его математического ожидания. Поскольку m x = 10, то нужно, чтобы

С другой стороны поэтому или Отсюда получаем, что n ³ 900 отсчетов.

2.2 Выборочная дисперсия

По выборочным данным важно знать не только выборочное среднее, но и разброс выборочных значений около выборочного среднего. Если выборочное среднее является оценкой генерального среднего, то выборочная дисперсия должна быть оценкой генеральной дисперсии. Выборочная дисперсия

для выборки, состоящей из случайных величин определяется следующим образом

Используя это представление выборочной дисперсии, найдем ее математическое ожидание

* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.

    Введение.

    Использованная литература.

Методы математической статистики

    Введение.

    Основные понятия математической статистики.

    Статистическая обработка результатов психолого-педагогических исследований.

    Использованная литература.

Методы математической статистики

    Введение.

    Основные понятия математической статистики.

    Статистическая обработка результатов психолого-педагогических исследований.

    Использованная литература.

      Введение.

Применение математики к другим наукам имеет смысл только в единении с глубокой теорией конкретного явления. Об этом важно помнить, чтобы не сбиваться на простую игру в формулы, за которой не стоит никакого реального содержания.

Академик Ю.А. Митропольский

Теоретические методы исследования в психологии и педагогике дают возможность раскрыть качественные характеристики изучаемых явлений. Эти характе­ристики будут полнее и глубже, если накопленный эмпирический ма­териал подвергнуть количественной обработке. Однако, проблема количественных измерений в рамках психолого-педагогических исследований очень сложна. Эта сложность заключается прежде всего в субъективно-причинном многообразии педагогической деятельности и ее результатов, в самом объекте измерения, находящимся в состоянии непрерывного движения и изменения. Вместе с тем введение в исследование количественных показателей сегодня является необходимым и обязательным компонентом получения объективных данных о результатах педагогического труда. Как правило, эти данные могут быть получены как путем прямого или опосредованного измерения различных составляющих педагогического процесса, так и посредством количественной оценки соответствующих параметров адекватно построенной его математической модели. С этой целью при исследо­вании проблем психологии и педагогики применяются методы математической статистики. С их помощью решаются различные задачи: обработка факти­ческого материала, получение новых, дополнительных данных, обоснование научной организации исследования и другие.

2. Основные понятия математической статистики

Исключительно важную роль в анализе многих психолого-педагогических явлений играют средние величины, представляющие собой обобщенную характеристи­ку качественно однородной совокупности по определенному количественно­му признаку. Нельзя, например, вычислить среднюю специальность или среднюю национальность студентов вуза, так как это качест­венно разнородные явления. Зато можно и нужно определить в среднем числовую характеристику их успеваемости (средний балл), эффек­тивности методических систем и приемов и т. д.

В психолого-педагогических исследованиях обычно применяются различные виды средних величин: средняя арифметическая, сред­няя геометрическая, медиана, мода и другие. Наиболее распространенными являются средняя арифметическая, медиана и мода.

Средняя арифметическая применяется в тех случаях, когда между определяю­щим свойством и данным признаком имеется прямо пропорциональная зави­симость (например, при улучшении показателей работы учебной группы улучшаются показатели работы каждого ее члена).

Средняя арифметическая представляет собой частное от деления сум­мы величин на их число и вычисляется по формуле:

где Х - средняя арифметическая; X1, X2, Х3 ... Хn - результаты отдельных наблюдений (приемов, действий),

n - количество наблюдений (приемов, действий),

Сумма результатов всех наблюдений (приемов, действий).

Медианой (Ме) называется мера среднего положения, характеризующая значение признака на упорядоченной (построенной по признаку возрастания или убывания) шкале, которое соответствует середине исследуемой совокупности. Медиана может быть определена для порядковых и количественных признаков. Место расположения этого значения определяется по формуле: Место медианы = (n + 1) / 2

Например. По результатам исследования установлено, что:

– на “отлично” учатся – 5 человек из участвующих в эксперименте;

– на “хорошо” учатся – 18 человек;

– на “удовлетворительно” – 22 человека;

– на “неудовлетворительно” – 6 человек.

Так как всего в эксперименте принимало участие N = 54 человека, то середина выборки равна человек. Отсюда делается вывод, что больше половины обучающихся учатся ниже оценки “хорошо”, то есть медиана больше “удовлетворительно”, но меньше “хорошо” (см. рисунок).

Мода (Мо) – наиболее часто встречающееся типичное значение признака среди других значений. Она соответствует классу с максимальной частотой. Этот класс называется модальным значением.

Например.

Если на вопрос анкеты: “укажите степень владения иностранным языком”, ответы распределились:

1 – владею свободно – 25

2 – владею в достаточной степени для общения – 54

3 – владею, но испытываю трудности при общении – 253

4 – понимаю с трудом – 173

5 – не владею – 28

Очевидно, что наиболее типичным значением здесь является – “владею, но испытываю трудности при общении”, которое и будет модальным. Таким образом, мода равна – 253.

Важное значение при использовании в психолого-педагогическом исследовании математических методов уделяется расчету дисперсии и среднеквадратических (стандартных) отклонений.

Дисперсия равна среднему квадрату отклонений значения варианты от среднего значения. Она выступает как одна из характеристик индивидуальных результатов разброса значений исследуемой переменной (например, оценок учащихся) вокруг среднего значения. Вычисление дисперсии осуществляется путем определения: отклонения от среднего значения; квадрата указанного отклонения; суммы квадратов отклонения и среднего значения квадрата отклонения (см. табл. 6.1).

Значение дисперсии используется в различных статистических расчетах, но не имеет непосредственного наблюдаемого характера. Величиной, непосредственно связанной с содержанием наблюдаемой переменной, является среднее квадратическое отклонение.

Таблица 6.1

Пример вычисления дисперсии

Значение

показателя

Отклонение

от среднего

отклонения

2 – 3 = – 1

Среднее квадратичное отклонение подтверждает типичность и показательность средней арифметической, отражает меру колебания численных значений признаков, из которых выводится средняя величина. Оно равно корню квадратному из дисперсии и определяется по формуле:

где: – средняя квадратическая. При малом числе наблюдения (действий) – менее 100 – в значении формулы следует ставить не “N”, а “N – 1”.

Средняя арифметическая и средняя квадратическая являются основны­ми характеристиками полученных результатов в ходе исследования. Они позволяют обобщить данные, сравнить их, установить преимущества одной психолого-педагогической системы (программы) над другой.

Среднее квадратическое (стандартное) отклонение широко применяется как мера разброса для различных характеристик.

Оценивая результаты исследования важно определить рассеивание случайной величины около среднего значения. Это рассеивание описывается с помощью закона Гауса (закона нормального распределения вероятности случайной величины). Суть закона заключается в том, что при измерении некоторого признака в данной совокупности элементов всегда имеют место отклонения в обе стороны от нормы вследствие множества неконтролируемых причин, при этом, чем больше отклонения, тем реже они встречаются.

При дальнейшей обработке данных могут быть выявлены: коэффициент вариации (устойчивости) исследуемого явления, представляющий собой процентное отношение среднеквадратического отклонения к средней ариф­метической; мера косости , показывающая, в какую сторону направлено преимущественное число отклонений; мера крутости , которая показывает степень скопления значений случайной величины около среднего и др. Все эти статистические данные помогают более полно выявить признаки изучаемых явлений.

Меры связи между переменными. Связи (зависимости) между двумя и более переменными в статистике называют корреляцией. Она оценивается с помощью значения коэффициента корреляции, который является мерой степени и величины этой связи.

Коэффициентов корреляции много. Рассмотрим лишь часть из них, которые учитывают наличие линейной связи между переменными. Их выбор зависит от шкал измерения переменных, зависимость между которыми необходимо оценить. Наиболее часто в психологии и педагогике применяются коэффициенты Пирсона и Спирмена.

Рассмотрим вычисление значений коэффициентов корреляции на конкретных примерах.

Пример 1. Пусть две сравниваемые переменные X (семейное положение) и Y (исключение из университета) измеряются в дихотомической шкале (частный случай шкалы наименований). Для определения связи используем коэффициент Пирсона.

В тех случаях, когда нет необходимости подсчитывать частоту появления различных значений переменных X и Y, удобно проводить вычисления коэффициента корреляции с помощью таблицы сопряженности (см. табл. 6.2, 6.3, 6.4), показывающей количество совместных появлений пар значений по двум переменным (признакам). А – количество случаев, когда переменная X имеет значение равное нулю, и, одновременно переменная Y имеет значение равное единице; В – количество случаев, когда переменные X и Y имеют одновременно значения, равные единице; С – количество случаев, когда переменные X и Y имеют одновременно значения равные нулю; D – количество случаев, когда переменная X имеет значение, равное единице, и, одновременно, переменная Y имеет значение, равное нулю.

Таблица 6.2

Общая таблица сопряженности

Признак X

В общем виде формула коэффициента корреляции Пирсона для дихотомических данных имеет вид

Таблица 6.3

Пример данных в дихотомической шкале

Подставим в формулу данные из таблицы сопряженности (см. табл. 6.4), соответствующей рассматриваемому примеру:

Таким образом, коэффициент корреляции Пирсона для выбранного примера равен 0,32, то есть зависимость между семейным положением студентов и фактами исключения из университета незначительная.

Пример 2. Если обе переменные измеряются в шкалах порядка, то в качестве меры связи используется коэффициент ранговой корреляции Спирмена (Rs). Он вычисляется по формуле

где Rs – коэффициент ранговой корреляции Спирмена; Di – разность рангов сравниваемых объектов; N – количество сравниваемых объектов.

Значение коэффициента Спирмена изменяется в пределах от –1 да + 1. В первом случае между анализируемыми переменными существует однозначная, но противоположено направленная связь (с увеличением значений одной уменьшается значения другой). Во втором – с ростом значений одной переменной пропорционально возрастает значение второй переменной. Если величина Rs равна нулю или имеет значение, близкое к нему, то значимая связь между переменными отсутствует.

В качестве примера вычисления коэффициента Спирмена используем данные из таблицы 6.5.

Таблица 6.5

Данные и промежуточные результаты вычисления значения коэффициента

ранговой корреляции Rs

Качества

Ранги, присвоенные экспертом

Разность рангов

Квадрат разности рангов

–1
–1
–1

Сумма квадратов разностей рангов Di = 22

Подставим данные примера в формулу для коэффициента Смирмена:

Результаты вычисления позволяют утверждать о наличии достаточно выраженной связи между рассматриваемыми переменными.

Статистическая проверка научной гипотезы. Доказательство статистической достоверности экспериментального влияния существенно отличается от доказательства в математике и формальной логике, где выводы носят более универсальный характер: статистические доказательства не являются столь строгими и окончательными – в них всегда допускается риск ошибиться в выводах и потому статистическими методами не доказывается окончательно правомерность того или иного вывода, а показывается мера правдоподобности принятия той или иной гипотезы.

Педагогическая гипотеза (научное предположение о преимуществе того или иного метода и т. п.) в процессе статистического анализа переводится на язык статистической науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез. Первая (основная) называется нулевой гипотезой (Н 0), в которой исследователь говорит о своей исходной позиции. Он (априори) как бы декларирует, что новый (предполагаемый им, его коллегами или оппонентами) метод не обладает какими-либо преимуществами, и потому с самого начала исследователь психологически готов занять честную научную позицию: различия между новым и старым методами объявляются равными нулю. В другой, альтернативной гипотезе (Н 1) делается предположение о преимуществе нового метода. Иногда выдвигается несколько альтернативных гипотез с соответствующими обозначениями.

Например, гипотеза о преимуществе старого метода (H 2). Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:

– первый уровень – 5% (в научных текстах пишут иногда р = 5% или а?0,05, если представлено в долях), где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;

– второй уровень – 1%, т. е. соответственно допускается риск ошибиться только в одном случае из ста (а?0,01, при тех же требованиях);

– третий уровень – 0,1%, т. е. допускается риск ошибиться только в одном случае из тысячи (а?0,001). Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется.

При сравнении средних арифметических экспериментальной и контрольной групп важно не только определить, какая средняя больше, но и насколько больше. Чем меньше разница между ними, тем более приемлемой окажется нулевая гипотеза об отсутствии статистически значимых (достоверных) различий. В отличие от мышления на уровне обыденного сознания, склонного воспринимать полученную в результате опыта разность средних как факт и основание для вывода, педагог-исследователь, знакомый с логикой статистического вывода, не будет торопиться в таких случаях. Он скорее всего сделает предположение о случайности различий, выдвинет нулевую гипотезу об отсутствии достоверных различий в результатах экспериментальной и контрольной групп и лишь после опровержения нулевой гипотезы примет альтернативную.

Таким образом, вопрос о различиях в рамках научного мышления переводится в другую плоскость. Дело не только в различиях (они почти всегда есть), а в величине этих различий и отсюда – в определении той разницы и границы, после которого можно сказать: да, различия неслучайны, они статистически достоверны, а значит, испытуемые этих двух групп принадлежат после эксперимента уже не к одной (как раньше), а к двум различным генеральным совокупностям и что уровень подготовленности учащихся, потенциально принадлежащих этим совокупностям, будет существенно отличаться. Для того чтобы показать границы этих различий, используются так называемые оценки генеральных параметров .

Рассмотрим на конкретном примере (см. табл. 6.6), как с помощью математической статистики можно опровергнуть или подтвердить нулевую гипотезу.

Допустим, необходимо определить зависит ли эффективность групповой деятельности студентов от уровня развития в учебной группе межличностных отношений. В качестве нулевой гипотезы выдвигается предположение, что такой зависимости не существует, а в качестве альтернативной – зависимость существует. Для этих целей сравниваются результаты эффективности деятельности в двух группах, одна из которых в этом случае выступает в качестве экспериментальной, а вторая – контрольной. Чтобы определить, является ли разность между средними значениями показателей эффективности в первой и во второй группе существенной (значимой), необходимо вычислить статистическую достоверность этой разницы. Для этого можно использовать t – критерий Стьюдента. Он вычисляется по формуле:

где X 1 и X 2 – среднее арифметическое значение переменных в группах 1 и 2; М 1 и М 2 – величины средних ошибок, которые вычисляются по формуле:

где - средняя квадратическая, вычисляемая по формуле (2).

Определим ошибки для первого ряда (экспериментальная группа) и второго ряда (контрольная группа):

Находим значение t – критерия по формуле:

Вычислив величину t – критерия, требуется по специальной таблице определить уровень статистической значимости различий между средними показателями эффективности деятельности в экспериментальной и контрольной группах. Чем выше значение t – критерия, тем выше значимость различий.

Для этого t расчетное сравниваем с t табличным. Табличное значение выбирается с учетом выбранного уровня достоверности (p = 0,05 или p = 0,01), а также в зависимости от числа степеней свободы, которое находится по формуле:

где U – число степеней свободы; N 1 и N 2 – число замеров в первом и во втором рядах. В нашем примере U = 7 + 7 –2 = 12.

Таблица 6.6

Данные и промежуточные результаты вычисления значимости статистических

Различий средних значений

Экспериментальная группа

Контрольная группа

Значение эффек-тивности деятельности

Для таблицы t – критерия находим, что значение t табл. = 3,055 для однопроцентного уровня (p

Однако педагогу-исследователю следует помнить, что существование статистической значимости разности средних значений является важным, но не единственным аргументом в пользу наличия или отсутствия связи (зависимости) между явлениями или переменными. Поэтому необходимо привлекать и другие аргументы количественного или содержательного обоснования возможной связи.

Многомерные методы анализа данных. Анализ взаимосвязи между большим количеством переменных осуществляется путем использования многомерных методов статистической обработки. Цель применения подобных методов – сделать наглядными скрытые закономерности, выделить наиболее существенные взаимосвязи между переменными. Примерами таких многомерных статистических методов являются:

    – факторный анализ;

    – кластерный анализ;

    – дисперсионный анализ;

    – регрессионный анализ;

    – латентно-структурный анализ;

    – многомерное шкалирование и другие.

Факторный анализ заключается в выявлении и интерпретации факторов. Фактор – обобщенная переменная, которая позволяет свернуть часть информации, т. е. представить ее в удобообозримом виде. Например, факторная теория личности выделяет ряд обобщенных характеристик поведения, которые в данном случае называются чертами личности.

Кластерный анализ позволяет выделить ведущий признак и иерархию взаимосвязей признаков.

Дисперсионный анализ – статистический метод, используемый для изучения одной или нескольких одновременно действующих и независимых переменных на изменчивость наблюдаемого признака. Его особенность состоит в том, что наблюдаемый признак может быть только количественным, в тоже время объясняющие признаки могут быть как количественными, так и качественными.

Регрессионный анализ позволяет выявить количественную (численную) зависимость среднего значения изменений результативного признака (объясняемой) от изменений одного или нескольких признаков (объясняющих переменных). Как правило данный вид анализа применяется тогда, когда требуется выяснить насколько изменяется средняя величина одного признака при изменении на единицу другого признака.

Латентно-структурный анализ представляет совокупность аналитико-статистических процедур выявления скрытых переменных (признаков), а также внутренней структуры связей между ними. Он дает возможность исследовать проявления сложных взаимосвязей непосредственно ненаблюдаемых характеристик социально-психологических и педагогических явлений. Латентный анализ может являться основой для моделирования указанных взаимосвязей.

Многомерное шкалирование обеспечивает наглядную оценку сходства или различия между некоторыми объектами, описываемыми большим количеством разнообразных переменных. Эти различия представляются в виде расстояния между оцениваемыми объектами в многомерном пространстве.

3. Статистическая обработка результатов психолого-педагогических

исследований

В любом исследовании всегда важно обеспечить массовость и предста­вительность (репрезентативность) объектов изучения. Для решения этого вопроса обычно прибегают к математическим методам расчета минимальной величины подлежащих исследованию объектов (групп респондентов), чтобы на этом основании можно было сделать объ­ективные выводы.

По степени полноты охвата первичных единиц статистика делит исс­ледования на сплошные, когда изучаются все единицы изучаемого явления, и выборочные, если изучению подвергается только часть интересующей со­вокупности, взятая по какому-либо признаку. Исследователю не всегда представляется возможность изучить всю совокупность явлений, хотя к этому постоянно следует стремиться (не хватает времени, средств, необ­ходимых условий и т. д.); с другой стороны, часто сплошное исследование просто не требуется, так как выводы будут достаточно точными после изучения определенной части первичных единиц.

Теоретической основой выборочного способа исследования является теория вероятностей и закон больших чисел. Чтобы исследование распола­гало достаточным количеством фактов, наблюдений, используют таблицу достаточно больших чисел. От исследователя в данном случае требуется установление величины вероятности и величины допускаемой ошибки. Пусть, например, допускаемая ошибка в выводах, которые должны быть сделаны в результате наблюдений, по сравнению с теоретическими предпо­ложениями, не должна превышать 0,05 как в положительную, так и в отри­цательную стороны (иначе говоря, мы можем ошибиться не более чем в 5 случаев из 100). Тогда по таблице достаточно больших чисел (см. табл. 6.7) находим, что правильное заключение может быть высказано в 9 случа­ев из 10 тогда, когда число наблюдений будет не менее 270, в 99 случа­ев из 100 при наличии не менее 663 наблюдений и т. д. Значит, с увели­чением точности и вероятности, с которой мы предполагаем сделать выво­ды, число требуемых наблюдений возрастает. Однако в психолого-педагогическом исследовании оно не должно быть чрезмерно большим. 300–500 наблюдений часто является вполне достаточным для основательных выводов.

Данный способ определения величины выборки является наиболее простым. Математическая статистика располагает и более сложными мето­дами вычисления требуемых выборочных совокупностей, которые подробно освещены в специальной литературе.

Однако соблюдение требований массовости еще не обеспечивает на­дежности выводов. Они будут достоверны тогда, когда выбранные для наб­людения (бесед, эксперимента и т. д.) единицы являются достаточно представительными для изучаемого класса явлений.

Таблица 6.7

Краткая таблица достаточно больших чисел

Величина

вероятности

Допустимая

Репрезентативность единиц наблюдения обеспечивается прежде всего их случайным выбором с помощью таблиц случайных чисел. Положим, требу­ется определить 20 учебных групп для проведения массового эксперимента из имеющихся 200. Для этого составляется список всех групп, который нумеруется. Затем из таблицы случайных чисел выписывается 20 номеров, начиная с какого-либо числа, через определенный интервал. Эти 20 случайных чисел по соблюдению номеров определяют те группы, которые нужны исследователю. Случайный выбор объектов из общей (гене­ральной) совокупности дает основание утверждать, что полученные при исследовании выборочной совокупности единиц результаты не будут резко отличаться от тех, которые имелись бы в случае исследования всей сово­купности единиц.

В практике психолого-педагогических исследований применяются не только простые случайные отборы, но и более сложные методы отбора: расслоенный случайный отбор, многоступенчатый отбор и др.

Математические и статистические методы исследования являются так­же средствами получения нового фактического материала. С этой целью используются приемы шаблонирования, повышающие информативную емкость анкетного вопроса и шкалирования, дающего возможность более точно оце­нивать действия как исследователя, так и исследуемых.

Шкалы возникли из-за необходимости объективно и точно диагности­ровать и измерять интенсивность определенных психолого-педагогических явлений. Шкалирование дает возможность упорядочить явления, количественно оце­нить каждое из них, определить низшую и высшую ступени исследуемого явления.

Так при исследовании познавательных интересов слушателей можно установить их границы: очень большой интерес – очень слабый интерес. Между этими границами ввести ряд ступеней, создающих шкалу познаватель­ных интересов: очень большой интерес (1); большой интерес (2); средний (3); слабый (4); очень слабый (5).

В психолого-педагогических исследованиях используются шкалы разных видов, например,

а) Трехмерная шкала

Очень активный……..…………..10

Активный…………………………5

Пассивный…...…………………...0

б) Многомерная шкала

Очень активный…………………..8

Среднеактивный………………….6

Не слишком активный…………...4

Пассивный………………………..2

Полностью пассивный…………...0

в) Двусторонняя шкала.

Очень интересуется……………..10

Достаточно интересуется………...5

Равнодушен……………………….0

Не интересуется…………………..5

Совершенно нет интереса………10

Числовые оценочные шкалы дают каждому пункту определенное число­вое обозначение. Так, при анализе отношения студентов к учебе, их настойчивости в работе, готовности к сотрудничеству и т.п. можно сос­тавить числовую шкалу на основе таких показателей: 1 – неудовлетвори­тельно; 2 – слабо; 3 – средне; 4 – выше среднего, 5 – намного выше среднего. В таком случае шкала приобретает следующий вид (см. табл. 6.8):

Таблица 6.8

Если числовая шкала биполярна, используется биполярная упорядо­ченность с нулевой величиной в центре:

Дисциплинированность Недисциплинированность

Ярко выраженная 5 4 3 2 1 0 1 2 3 4 5 Не ярко выраженная

Оценочные шкалы могут быть изображены графически. В этом случае они выражают категории в наглядной форме. При этом каждое деление (ступень) шкалы характеризуется вербально.

Рассматриваемые методы играют большую роль в анализе и обобще­нии полученных данных. Они позволяют установить различные соотношения, корреляции между фактами, выявить тенденции в развитии психолого-педагогических явлений. Так, теория группировок математической статистики помогает определить, какие факты из собранного эмпирического материала сопоста­вимы, по какому основанию их правильно сгруппировать, какой степени достоверности они будут. Все это позволяет избежать произвольных мани­пуляций с фактами и определить программу их обработки. В зависимости от целей и задач обычно применяют три вида группировок: типологичес­кую, вариационную и аналитическую.

Типологическая группировка используется, когда необходимо разбить полученный фактический материал на качественно однородные единицы (распределение количества нарушений дисциплины между различными категориями студентов, разбивка показателей выполнения ими физических упражнений по годам учебы и т.п.).

В случае необходимости сгруппировать материал по величине како­го-либо изменяющегося (варьирующего) признака – разбивка групп обучающихся по уровню успеваемости, по процентам выполнения заданий, однотип­ным нарушениям установленного порядка и т.п. – применяется вариацион­ная группировка , дающая возможность последовательно судить о структуре изучаемого явления.

Аналитический вид группировки помогает устанавливать взаимосвязь между изучаемыми явлениями (зависимость степени подготовки студентов от различных методов обучения, качества выполняемых заданий от темпе­рамента, способностей и т.д.), их взаимозависимость и вза­имообусловленность в точном исчислении.

Насколько важна работа исследователя по группировке собранных данных, свидетельствует тот факт, что ошибки в этой работе обесценива­ют самую исчерпывающую и содержательную информацию.

В настоящее время математические основы группировки, типоло­гии, классификации получили наиболее глубокое развитие в социологии. Современные подходы и методы типологии и классификации в социологичес­ких исследованиях могут быть с успехом применены в психологии и педагогике.

В ходе исследования используются приемы итогового обобщения дан­ных. Одним из них является прием составления и изучения таблиц.

При составлении сводки данных относительно одной статистической величины образуется ряд распределения (вариационный ряд) значения этой величины. Примером такого ряда (см. табл. 6.9) может служить сводка данных относительно окружности груди 500 лиц.

Таблица 6.9

Сводка данных одновременно по двум и более статистическим величи­нам предполагает составление таблицы распределения, раскрывающей расп­ределение значений одной статической величины в соответствии со значе­ниями, которые принимают другие величины.

В качестве иллюстрации при­водится таблица 6.10, составленная на основании статистических данных от­носительно окружности груди и веса этих людей.

Таблица 6.10

Окружность груди в см

Таблица распределения дает представление о соотношении и связи, существующих между двумя величинами, а именно: при малом весе частоты располагаются в верхней левой четверти таблицы, что указывает на пре­обладание лиц с малой окружностью груди. По мере увеличения веса до среднего значения распределение частот передвигается в центр таблички. Это указывает, что люди, вес которых ближе к среднему, имеют окруж­ность груди, также близкую к среднему значению. При дальнейшем увели­чении веса частоты начинают занимать правую нижнюю четверть таблички. Это свидетельствует о том, что у человека с весом более среднего ок­ружность груди также выше среднего объема.

Из таблицы следует, что установленная связь не строгая (функцио­нальная), а вероятностная, когда с изменениями значений одной величины другая изменяется как тенденция, без жесткой однозначной зависимости. Подобные связи и зависимости часто встречаются в психологии и педагогике. В настоя­щее время они выражаются обычно с помощью корреляционного и регрессивного анализа.

Вариационные ряды и таблицы дают представление о статике явления, динамику же могут показать ряды развития, где первая строка содержит последовательные этапы или промежутки времени, а вторая – полученные на этих этапах значения изучаемой статистической величины. Так выявля­ются возрастание, убывание или периодические изменения изучаемого яв­ления, вскрываются его тенденции, закономерности.

Таблицы могут заполняться абсолютными величинами, или сводными цифрами (средними, относительными). Результаты статистической работы – помимо таблиц часто изображаются графически в виде диаграмм, фигур и т. д. Основными способами графического изображения статистических вели­чин являются: способ точек, способ прямых и способ прямоугольников. Они просты и доступны каждому исследователю. Техника их использования – проведение осей координат, установление масштаба, и выписка обозна­чения отрезков (точек) на горизонтальных и вертикальной осях.

Диаграммы, изображающие ряды распределения значений одной статис­тической величины, позволяют составить кривые распределения.

Графическое изображение двух (и более) статистических величин да­ет возможность образовать некоторую кривую поверхность, называемую по­верхностью распределения. Ряд развития при графическом исполнении об­разуют кривые развития.

Графическое изображение статистического материала позволяет глуб­же проникнуть в смысл цифровых величин, уловить их взаимозависимости и черты изучаемого явления, которые трудно заметить в таблице. Исследо­ватель освобождается от той работы, которую он вынужден был бы проде­лать, чтобы разобраться с обилием цифр.

Таблицы и графики – важные, но только первые шаги в исследовании статистических величин. Основным же методом является аналитический, оперирующий математическими формулами, с помощью которых выводятся так называемые “обобщающие показатели”, то есть абсолютные величины, при­веденные в сравнимый вид (относительные и средние величины, балансы и индексы). Так, с помощью относительных величин (процентов) определяют­ся качественные особенности анализируемых совокупностей (например, отношение отличников к общему числу студентов; числа ошибок при работе на сложной аппаратуре, вызванных психической неус­тойчивостью обучающихся, к общему числу ошибок и т.п.). То есть выявля­ются отношения: части к целому (удельный вес), слагаемых к сумме (структура совокупности), одной части совокупности к другой ее части; характеризующие динамику каких-либо изменений во времени и др.

Как видно, даже самое общее представление о методах статистичес­кого исчисления говорит о том, что эти методы располагают большими возможностями в анализе и обработке эмпирического материала. Разумеет­ся, математический аппарат может бесстрастно обработать все, что в не­го вложит исследователь и достоверные данные, и субъективные домыслы. Вот почему совершенное владение математическим аппаратом обработки на­копленного эмпирического материала в единстве с доскональным знанием качественных характеристик исследуемого явления является необходимым для каждого исследователя. Только в этом случае возможен отбор качест­венного, объективного фактического материала, его квалифицированная об­работка и получение достоверных итоговых данных.

Такова краткая характеристика наиболее часто применяемых методов исследования проблем психологии и педагогики. Следует подчеркнуть, что ни один из рассмотренных методов, взятый сам по себе, не может претендовать на универсальность, на полную гарантию объективности получаемых данных. Так, элементы субъективизма в ответах, полученных путем опроса респондентов, очевидны. Результаты наблюдений, как правило, не свободны от субъективных оценок самого исследователя. Данные, взятые из различной документации, требуют одновременно проверки достоверности этой доку­ментации (особенно личных документов, документов из “вторых рук” и т.д.).

Поэтому каждому исследователю следует стремиться, с одной сторо­ны, к совершенствованию техники применения любого конкретного метода, а с другой – к комплексному, взаимоконтролирующему использованию раз­ных методов для изучения одной и той же проблемы. Владение всей систе­мой методов дает возможность разработать рациональную методику иссле­дования, четко организовать и провести его, получить существенные тео­ретические и практические результаты.

    Использованная литература.

    Шевандрин Н.И. Социальная психология в образовании: Учебное пособие. Ч.1. Концептуальные и прикладные основы социальной психологии. – М.: ВЛАДОС, 1995.

2. Давыдов В.П. Основы методологии, методики и технологии педагогического исследования: Научно-методическое пособие. – М.: Академия ФСБ, 1997.