Основные статистические характеристики ряда измерений. Расчет основных статистических характеристик и взаимосвязь результатов измерений Характеристики статистических данных

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ

ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

КОЛЛЕДЖ СВЯЗИ № 54 имени П.М. ВОСТРУХИНА

Статистические характеристики.

Учебное пособие к занятию часть 1.

Разработчик:

Преподаватель математики

Т.Н. Рудзина


– это математические понятия , с помощью которых описываются отличительные особенности и свойства совокупности данных , полученных с помощью наблюдений или каким-то другим способом. Значение характеристик состоит еще и в том, что они «подсказывают» , с каких позиций целесообразно анализировать имеющуюся совокупность данных .

К статистическим характеристикам относятся:

среднее арифметическое , размах , мода , медиана .

Рассмотрим пример:

При изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определенный день время (в минутах), затраченное им на выполнения домашнего задания по алгебре. Получили такие данные:

23, 18, 25 20, 25, 25, 32, 37, 34, 26 34, 25 .

Имея этот ряд данных, можно определит ь, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре.

Для этого указанные числа надо сложить и сумму разделить на 12:


Число 27 , полученное в результате, называют средним арифметическим рассматриваемого ряда чисел.

Определение :

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.

Обычно среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1 га в районе, средний суточный удой молока от одной коровы на ферме, среднюю зарплату одного рабочего бригады за смену и т.д. Заметим, что среднее арифметическое находят только для однородных величин. Не имеет смысла, например, использовать в качестве обобщающего показателя среднюю урожайность зерновых и бахчевых культур. Причем и для однородных величин вычисление среднего арифметического бывает иногда лишено смысла, например нахождение средней температуры больных в госпитале, среднего размера обуви…


В рассмотренном примере мы нашли, что в среднем учащиеся затратили на выполнение домашнего задания по алгебре по 27 мин. Однако анализ приведенного ряда данных показывает, что время, затраченное некоторыми учащимися, существенно отличается от 27 мин., т.е. от среднего арифметического. Наибольший расход равен 37 мин., а наименьший – 18 мин. Разность между наибольшим и наименьшим расходом времени составляет 19 мин. В этом случае говорят, что размах ряда равен 19.

Определение :

Размахом ряда чисел называется разность между наибольшим и наименьшим из этих чисел.

Размах находят тогда, когда хотят определить, как велик разброс данных в ряду.


При анализе сведений о времени, затраченном семиклассниками на выполнение домашнего задания по алгебре, нас могут интересовать не только среднее арифметическое и размах полученного ряда данных, но и другие показатели. Интересно, например, знать, какой расход времени является типичным для выделенной группы учащихся, т.е. какое число встречается в ряду данных чаще всего. Нетрудно заметить, что таким числом является число 25. Говорят, что число 25 – мода рассматриваемого ряда.

Определение :

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду .

Ряд чисел может иметь более одной моды или не иметь моду совсем.

Например, в ряду чисел 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 две моды – это числа 47 и 52 , так как каждое из этих чисел встречается два раза, а остальные числа встречаются в ряду менее двух раз, а в ряду чисел 69, 68, 66, 70, 67, 71, 74, 63, 73, 72 – моды нет.


Рассмотрим еще одну статистическую характеристику.

Начнем с примера. В таблице показан расход электроэнергии в январе жильцами девяти квартир

Составим из данных, приведенных в таблице, упорядоченный ряд:

64, 72, 72, 75, 78 , 82, 85, 91, 93.

В полученном упорядоченном ряду девять чисел. Не трудно заметить, что в середине ряда расположено число 78: слева от него записано четыре числа и справа тоже четыре числа. Говорят, что число 78 является срединным числом, или, иначе, медианой , рассматриваемого упорядоченного ряда чисел (от латинского слова mediana , которое означает «среднее»). Это число считают также медианой исходного ряда данных.


Приведем теперь другой пример. Пусть при сборе данных о расходе электроэнергии к указанным девяти квартирам добавили еще десятую. Получили такую таблицу:

Так же как в первом случае, представим полученные данные в виде упорядоченного ряда чисел:

64, 72, 72, 75, 78 , 82 , 85, 88, 91, 93

В этом числовом ряду четное число членов и имеются два числа, расположенные в середине ряда: 78 и 82 .

Число 80 , не являясь членом ряда, разбивает этот ряд на две одинаковые по численности группы: слева от него находятся пять членов ряда и справа тоже пять членов ряда:


64, 72, 72, 75, 78, 82, 85, 88, 91, 93

Говорят, что в этом случае медианой рассматриваемого упорядоченного ряда, а также исходного ряда данных, записанного в таблице, является число 80 .

Определение :

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с нечетным числом членов называется среднее арифметическое двух чисел, записанных посередине.

Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.


Если в упорядоченном числовом ряду содержится 2 n -1 членов, то медианой ряда является n -й член, так как n – 1 членов стоит до n -го члена и n – 1 членов – после n -го члена.

Если в упорядоченном ряду содержится 2 n членов, то медианой является среднее арифметическое членов, стоящих на n -м и n + 1 -м местах.

В каждом из рассмотренных выше примеров, определив медиану , мы можем указать номер квартиры, для которой расход электроэнергии жильцами превосходит срединное значение, т.е. медиану .

Рассмотрим еще один пример.

Известно, что 34 сотрудника отдела приобрели акции некоторого акционерного общества. Данные о числе акций, приобретенных сотрудниками, представлены в виде следующего упорядоченного ряда:

2, 2, 2, 2, 2, 3, 3, ……, 3, 4, 4, ……., 4, 100

Найдем медиану этого ряда. Так как всего в ряду 34 числа, то медиана равна среднему арифметическому 17– го и 18- го членов, т.е. равна (3 + 4) : 2 = 3,5

Вычисляя среднее арифметическое этого ряда, найдем, что оно приближенно равно 6,2, т.е. в среднем сотрудники отдела приобрели примерно по 6 акций. Мы видим, что в данном случае медиана лучше отражает реальную ситуацию, так как все сотрудники, кроме одного, приобрели не более 4 акций.

Такие показатели, как среднее арифметическое , мода и медиан а, по-разному характеризуют данные, полученные в результате наблюдений. Поэтому на практике при анализе данных в зависимости от конкретной ситуации используют либо все три показателя, либо некоторые из них.

Если, например, анализируются сведения о годовых доходах нескольких туристических фирм города, то удобно использовать все три показателя. Среднее арифметическое покажет средний годовой доход фирм, мода будет характеризовать типичный показатель годового дохода, медиана позволит определить туристические фирмы, годовой доход которых ниже среднего показателя.

Если изучают данные о размерах мужской обуви, проданной в определенный день в универмаге, то удобно воспользоваться таким показателем как мода , который характеризует размер, пользующийся наибольшим спросом. Находить в этом случае среднее арифметическое или медиану не имеет смысла .

При анализе результатов, показанных участниками заплыва на дистанцию 100 и, наиболее приемлемой характеристикой является медиана . Знание медианы позволит выделить для участия в соревнованиях группу спортсменов, показавших результаты выше среднего.

Статистические характеристики : среднее арифметическое , мод а, медиана называются средними результатами измерений .

Основные статистические характеристики делят на две основные группы: меры центральной тенденции и характеристики вариации.

Центральную тенденцию выборки позволяют оценить такие статистические характеристики, как среднее арифметическое значение, мода, медиана.

Наиболее просто получаемой мерой центральной тенденции является мода. Мода (Мо) – это такое значение в множестве наблюдений, которое встречается наиболее часто. В совокупности значений (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) модой является 9, потому что оно встречается чаще любого другого значения. В случае, когда все значения в группе встречаются одинаково часто, считают, что эта группа не имеет моды.

Когда два соседних значения в ранжированном ряду имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений.

Если два несмежных значения в группе имеют равные частоты, и они больше частот любого значения, то существуют две моды (например, в совокупности значений 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются 11 и 14); в таком случае группа измерений или оценок является бимодальной .

Наибольшей модой в группе называется единственное значение, которое удовлетворяет определению моды. Однако во всей группе может быть несколько меньших мод. Эти меньшие моды представляют собой локальные вершины распределения частот.

Медиана(Me) – середина ранжированного ряда результатов измерений. Если данные содержат четное число различных значений, то медиана есть точка, лежащая посередине между двумя центральными значениями, когда они упорядочены.

Среднее арифметическое значение для неупорядоченного ряда измерений вычисляют по формуле:

,

где
. Например, для данных 4,1; 4,4; 4,5; 4,7; 4,8 вычислим :

.

Каждая из выше вычисленных мер центра является наиболее пригодной для использования в определенных условиях.

Мода вычисляется наиболее просто – ее можно определить на глаз. Более того, для очень больших групп данных это достаточно стабильная мера центра распределения.

Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления. Эта мера получается особенно легко в случае ранжированных данных.

Среднее множество данных предполагает в основном арифметические операции.

На величину среднего влияют значения всех результатов. Медиана и мода не требуют для определения всех значений. Посмотрим, что произойдет со средним, медианой и модой, когда удвоится максимальное значение в следующем множестве:



Множество 1: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

Множество 2: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

На величину среднего особенно влияют результаты, которые называют “выбросами”, т.е. данные, находящиеся далеко от центра группы оценок.

Вычисление моды, медианы или среднего – чисто техническая процедура. Однако выбор из этих трех мер и их интерпретация зачастую требуют определенного размышления. В процессе выбора следует установить следующее:

– в малых группах мода может быть совершенно нестабильной. Например, мода группы: 1, 1, 1, 3, 5, 7, 7, 8 равна 1; но если одна из единиц превратится в нуль, а другая – в два, то мода будет равна 7;

– на медиану не влияют величины “больших” и “малых” значений. Например, в группе из 50 значений медиана не изменится, если наибольшее значение утроится;

– на величину среднего влияет каждое значение. Если одно какое-нибудь значение меняется на c единиц, изменится в том же направлении на c/n единиц;

– некоторые множества данных не имеют центральной тенденции, что часто вводит в заблуждение при вычислении только одной меры центральной тенденции. Особенно это справедливо для групп, имеющих более чем одну моду;

– когда считают, что группа данных является выборкой из большой симметричной группы, среднее выборки, вероятно, ближе к центру большой группы, чем медиана и мода.

Все средние характеристики дают общую характеристику ряда результатов измерений. На практике нас часто интересует, как сильно каждый результат отклоняется от среднего значения. Однако легко можно представить, что две группы результатов измерений имеют одинаковые средние, но различные значения измерений. Например, для ряда 3, 6, 3 – среднее значение = 4; для ряда 5, 2, 5 – также среднее значение = 4, несмотря на существенное различие этих рядов.

Поэтому средние характеристики всегда необходимо дополнять показателями вариации, или колеблемости.



К характеристикам вариации , или колеблемости , результатов измерений относят размах варьирования, дисперсию, среднее квадратическое отклонение, коэффициент вариации, стандартную ошибку средней арифметической.

Самой простой характеристикой вариации является размах варьирования . Его определяют как разность между наибольшим и наименьшим результатами измерений. Однако он улавливает только крайние отклонения, но не отражает отклонений всех результатов.

Чтобы дать обобщающую характеристику, можно вычислить отклонения от среднего результата. Например, для ряда 3, 6, 3 значения будут следующими: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Сумма этих отклонений (– 1) + 2 + (– 1) всегда равна 0. Чтобы избежать этого, значения каждого отклонения возводят в квадрат: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Значение делает отклонения от средней более явственными: малые отклонения становятся еще меньше (0,5 2 =0,25), а большие – еще больше (5 2 = 25). Получившуюся сумму называют суммой квадратов отклонений . Разделив эту сумму на число измерений, получают средний квадрат отклонений, или дисперсию . Она обозначается s 2 и вычисляется по формуле:

.

Если число измерений не более 30, т.е. n ≤ 30, используется формула:

.

Величина n – 1 = k называется числом степеней свободы , под которым подразумевается число свободно варьирующих членов совокупности. Установлено, что при вычислении показателей вариации один член эмпирической совокупности всегда не имеет степени свободы.

Эти формулы применяются, когда результаты представлены неупорядоченной (обычной) выборкой.

Из характеристик колеблемости наиболее часто используется среднее квадратическое отклонение , которое определяется как положительное значение корня квадратного из значения дисперсии, т.е.:

.

Среднее квадратическое отклонение или стандартное отклонение характеризует степень отклонения результатов от среднего значения в абсолютных единицах и имеет те же единицы измерения, что и результаты измерения.

Однако для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения, эта характеристика не пригодна.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах. Вычисляется он по формуле:

.

В спортивной практике колеблемость результатов измерений в зависимости от величины коэффициента вариации считают небольшой
(0 – 10 %), средней (11 – 20 %) и большой (V > 20 %).

Коэффициент вариации имеет большое значение в статистической обработке результатов измерений, т. к., будучи величиной относительной (измеряется в процентах), позволяет сравнивать между собой колеблемость результатов измерений, имеющих различные единицы измерения. Коэффициент вариации можно использовать лишь в том случае, если измерения выполнены в шкале отношений.

Разделы: Математика

Урок 1. «Среднее арифметическое, размах и мода»

Тип урока

Цели :

  • обучающая – формирование представления о простейших статистических характеристиках и их использовании при анализе данных, полученных в результате исследования;
  • развивающая
  • воспитательная – подготовка учащихся к проблемам современной жизни (понимание и интерпретация результатов статистических исследований).

Оборудование : проектор.

Ход урока

I. Организационный момент

Слышали ли вы когда-нибудь такую песню: «Потому что на десять девчонок по статистике девять ребят»? Как вы думаете, что это значит?

Сегодня мы познакомимся с новой наукой – статистикой. Узнаем, что она изучает и как можно применить те знания, которые вы сейчас получите.

III. Актуализация знаний

– Какое число называют средним арифметическим нескольких чисел?

(Средним арифметическим нескольких чисел называют частное от деления суммы этих чисел на число слагаемых).

Задача : дан ряд чисел 5, 6, 8, 12, 15, 4, 17, 8, 10, 15.

  1. Найдите среднее арифметическое ряда чисел.
  2. Найдите наибольшее и наименьшее значение ряда чисел, вычислите их разность.

IV. Первичное усвоение, осознание и осмысление нового материала

– Ребята, вы начинаете изучать новый предмет: «Элементы статистики и теории вероятностей».

– Где в реальной повседневной жизни мы сталкиваемся с этими науками?

– Вы что-нибудь слышали об этом разделе математики?

– А разве вам не приходилось подсчитывать среднюю скорость движения, средний бал ученика, класса. Подготовку человека к таким проблемам во всем мире осуществляет школьный курс математики, и в частности ее раздел «Математическая статистика».

Статистика – наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных массовых явлениях, происходящих в природе и обществе. Слово «статистика» происходит от латинского слова status , которое означает «состояние, положение вещей». Статистика изучает численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и многое другое. Результаты статистических исследований широко используются для практических и научных выводов. Вам было дано задание: измерить время, затраченное на выполнение домашнего задания по алгебре.

Мы получили следующие результаты: 27, 25, 26, 25, 40, 38, 38, 25 и т.д.

Имея этот ряд данных, можно определить, сколько минут в среднем затратили учащиеся на выполнение домашнего задания.

– Что для этого нужно сделать? (сложить все числа и разделить полученную сумму на их количество).

Число 28, полученное в результате, называют средним арифметическим рассматриваемого ряда. Обозначение: .

Мы вычислили, что на выполнение домашнего задания по алгебре учащиеся затратили в среднем 28 минут. Проводя аналогичные наблюдения, можно проследить, какова была средняя затрата времени на выполнение в какой-либо день домашнего задания по алгебре и русскому языку.

Заметим, что иногда вычисление среднего арифметического не дает полезной информации, так как время, затраченное некоторыми учащимися, значительно отличается от среднего арифметического.

Наибольший расход времени равен 40 минут, а наименьший расход времени равен 18 минут. Разность между наибольшим и наименьшим значением называется размахом ряда .

Размах ряда находят тогда, когда хотят определить, как велик разброс данных в ряду.

Ребята, нас могут интересовать не только среднее арифметическое и размах, но и другие показатели.

Например, интересно знать, какое число встречается в ряду данных чаще всего.

Таким числом является число 25. Число, наиболее часто встречающееся в данном ряду, называется модой чисел.

Ряд может иметь две моды, а может не иметь моды. Например, 47, 46, 50, 52, 47, 49, 52, 55 – имеет две моды: 47 и 52.

69, 68, 66, 70, 67, 71, 74, 63, 73, 72 – этот ряд не имеет моды.

– Ребята, где еще можно встретить понятие моды ряда чисел?

– Данные о размерах мужских сорочек, проданных в определенный день в универмаге. Здесь мода – размер пользующихся спросом, мода – цены на товар распространенный на рынке и т.п.

V. Закрепление изученного материала

При выставлении оценок учитель также вычисляет среднее арифметическое ваших текущих оценок.

Сейчас вы получите выписку ваших оценок по алгебре за I четверть.

Вы должны вычислить среднее арифметическое, моду и размах.

VI. Подведение итогов урока

«В среднем в день ребёнок улыбается 400 раз, взрослый - 17. Теперь все улыбнулись, чтобы испортить статистику»

VIII. Рефлексия

п. 9, 168 (а, б), 172, 178

Урок 2. «Медиана как статистическая характеристика»

Тип урока : ознакомление с новым материалом.

Цели :

  • обучающая – ввести понятие медианы, организовать деятельность учащихся по закреплению медианы, среднего арифметического, размаха и моды, обеспечить отработку навыка их применения при выполнении различных заданий;
  • развивающая – знакомство с разделом математики: «статистика и теория вероятностей» и его местом в системе научного познания мира;
  • воспитательная – подготовка учащихся к проблемам современной жизни (понимание и интерпретация результатов статистических исследований).

Оборудование : проектор

Ход урока

I. Организационный момент

II. Проверка домашнего задания

III. Сообщение темы и целей урока

Сегодня на уроке мы повторим алгоритм нахождения среднего арифметического, размаха и моды, и узнаем, как находится еще одна характеристика – медиана.

IV. Актуализация опорных знаний учащихся

1. Фронтальный опрос.

  1. Что называется средним арифметическим ряда чисел? Может ли среднее арифметическое ряда чисел не совпадать ни с одним из этих чисел?
  2. Что называется модой ряда чисел? Любой ли ряд чисел имеет моду? Может ли ряд чисел иметь более одной моды? Может ли мода ряда чисел не совпадать ни с одним из этих чисел?

2. Устный счет.

а) Дан ряд чисел: 3, 5, 1, 7, 9. Найти среднее арифметическое, размах и моду.
б) Дан ряд чисел: 1, 2, 2, 5, 5. Найти среднее арифметическое, размах и моду.

V. Первичное усвоение, осознание и осмысление нового материала

Задача . В небольшой фирме 10 сотрудников: 7 рабочих, мастер, бухгалтер, директор. Зарплата у рабочих: 2000, у мастера 4000, у бухгалтера 16000, у директора 40000. Найдите чему будет равна средняя зарплата на этом предприятии?

Но достаточно ли этой характеристики работнику, который устраивается работать рабочим? (Нет)

В этом случае используют другую статистическую характеристику – медиану.

Запишем алгоритм нахождения медианы набора чисел:

  1. Упорядочить числовой набор.
  2. Одновременно зачеркиваем “самое большое” и “самое маленькое” числа данного набора чисел до тех пор, пока не останется одно число или два числа.
  3. Если осталось одно число, то оно и есть медиана.
  4. Если осталось два числа, то медианой будет среднее арифметическое двух оставшихся чисел.

Медиану используют вместо средней арифметической, когда крайние варианты упорядоченного ряда (наименьшая и наибольшая) по сравнению с остальными оказываются чрезмерно большими или чрезмерно малыми.

VI. Закрепление изученного материала

Задача 2 . В таблице приведена информация о длине основных рек, протекающих по территории округа Домодедово Московской области.

а) Найдите среднюю длину рек (среднее арифметическое);
б) Найдите длину рек в среднем (медиану данных);
в) По вашему мнению, какая из этих характеристик – среднее арифметическое или медиана – лучше описывает длину рек, протекающих в Домодедовском районе? Ответ объясните.

Ответ: а) 186 км, б) 41 км, в) медиана, т.к. данные содержат значения сильно отличающиеся от всех прочих.

Итак, для характеристики статистической информации используют среднее арифметическое и медиану. Во многих случаях одна из характеристик может не иметь никакого содержательного смысла.

VI. Подведение итогов урока

У статистиков есть шутка: средняя глубина озера 0,5 м, а корова все-таки утонула. Как вы понимаете эту фразу?

Выставление оценок за работу на уроке.

VIII. Рефлексия

Раздать карточки для рефлексии.

<Приложение 1>

VII. Постановка домашнего задания п.10, 187, 190, 193

Урок 3. «Статистические характеристики»

Тип урока : закрепление изученного.

Цели :

  • обучающая – закрепить полученные знания и умения, применять статистические характеристики при решении простейших задач;
  • развивающая –
  • воспитательная – подготовка учащихся к проблемам современной жизни, воспитание познавательной активности, культуры диалога.

Оборудование : карточки для выполнения проверочной работы.

Ход урока

I. Организационный момент

II. Проверка домашнего задания, уточнение направлений актуализации материала

<Приложение 2>

III. Сообщение темы, цели и задач урока, мотивация учения

Сегодня на уроке мы продолжим находить основные статистические характеристики числовых рядов.

IV. Воспроизведение изученного и их первичное применение в новых или измененных условиях с целью формирования умений

1. Фронтальный опрос

  1. Что такое статистика?
  2. Что называется средним арифметическим ряда чисел?
  3. Что называется размахом ряда чисел?
  4. Что называется модой ряда чисел?
  5. Любой ли ряд имеет моду?
  6. Может ли ряд иметь более одной моды?
  7. Может ли мода ряда чисел не совпадать ни с одним из этих чисел?
  8. Что называется медианой ряда чисел?
  9. Какой ряд называется упорядоченным рядом чисел?

2. Решение задач

В таблице приведены расходы учащегося 7 класса за 4 дня:

Определить какая статистическая характеристика находится в каждом задании:

а) 100+75+50+75=30;
300:4=75;
___=75 р.

Б) 50, 75, 75, 100;
(75+75):2 = 75;
___=75 р.

В) 100, 75, 50, 75;
___=75 р.

Г) 100-50=50;
___=50 р.

3. Решение заданий повышенной сложности

V. Проверочная работа

Выдаются карточки с заданием. Эти карточки подписываются учащимися. Задания выполняются на этих карточках в течение 3-5 минут.

Ребята меняются карточками. И по готовым ответам на доске проверяют работы друг друга и выставляют отметки согласно предложенным критериям.

Оценка: «5» – всё верно; «4» – 3 задания выполнены верно; «3» – 2 задания выполнены верно; «2» – выполнено верно менее двух зданий.

Работы сдаются учителю для просмотра и анализа усвоения материала.

VI. Подведение итогов урока

Выставление оценок за урок.

VII. Рефлексия

Раздать карточки для рефлексии.

<Приложение 1>

VIII. Постановка домашнего задания №182, №183, №193

Провести сбор информации на тему: «Размер обуви учеников 7 класса», «Рост учеников 7 класса», «Количество детей в семье учеников 7 класса» (в трех экземплярах) < Приложение 5 >

Урок 4. «Статистические характеристики нашего класса»

Тип урока : обобщения и систематизации знаний.

Цели :

  • обучающая – повторение и закрепление пройденного материала, введение понятия статистического исследования, продемонстрировать удобные способы упорядочивания и систематизации больших объёмов информации;
  • развивающая – развитие математически грамотной речи, логического мышления;
  • воспитательная – воспитание познавательной активности, культуры диалога.

Оборудование : таблицы для заполнения данных.

Ход урока

I. Организационный момент

II. Сообщение темы и целей урока

– На перемене я собрала ответы на все ваши вопросы. Все готовы приступить к групповому исследованию. Начинаем заключительный урок по теме “Статистические характеристики”.

III. Воспроизведение и коррекция опорных знаний

  1. Что такое статистика?
  2. Какие статистические характеристики вы знаете?

IV. Обобщение и систематизация понятий, усвоение системы знаний и их применение для объяснения новых фактов и выполнения практических заданий

Сегодня на уроке мы проведем с вами статистическое исследование.

Запишем основные этапы статистического исследования:

  1. Сбор данных.
  2. Систематизация данных – представление данные в табличном виде.
  3. Анализ данных – нахождение статистических характеристик, выводы.

Рассмотрим следующую задачу:

В женском обувном магазине провели статистические исследования и составили соответствующую таблицу по цене обуви и количества продаж:

Первый и второй этап статистического исследования уже пройдены: данные собраны и систематизированы. Осталось произвести анализ данных.

Для данных показателей надо найти статистические характеристики и объяснить их значение. После ученики должны ответить на следующие вопросы:

  1. Из данных ценовых категорий, обувь за какую цену не следует продавать магазину?
  2. Обувь, по какой цене следует распространять?
  3. К какой цене лучше стремиться?

По каким параметрам еще можно провести статистические исследования в обувном магазине?

V. Усвоение ведущих идей и основных теорий на основе широкой систематизации знаний

Проведем собственное статистическое исследование. У вас было домашнее задание: принести данные о своем росте, размере обуви и количестве детей в семье.

Сейчас каждый ряд получит свое задание <Приложение 5 >:

  1. Провести статистическое исследование роста учащихся вашего класса.
  2. Провести статистическое исследование размера обуви.
  3. Провести статистическое исследование количества детей в семье.

Так как статистическое исследование состоит из трех этапов, а первый этап – сбор данных мы уже провели, то вы можете переходить ко второму этапу – систематизации данных. Для этого данные занесите в таблицы.

После того как вы провели систематизацию данных, можно переходить к следующему этапу – анализу данных. Найдите статистические характеристики: среднее арифметическую, моду, медиану и размах ряда. Сделайте выводы.

VI. Подведение итогов урока

Вы все отлично справились с заданием. Выставление оценок за работу на уроке.

VII. Постановка домашнего задания

Провести исследование на тему: «Рост учащихся 8 класса».

VII. Рефлексия

Раздать карточки для рефлексии.

<Приложение 1>

Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel 2010 и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.

Теоретическая часть

Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных ), используются методы математической статистики.

Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику . Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.

Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности

Полученный в результате обследования набор чисел называетсястатистической совокупностью.

Выборочной совокупностью (или выборкой ) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Для статистической обработки результаты исследования объектов представляют в виде чисел x 1 , x 2 , …, x k . Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения x i называются вариантами , а числа их повторений n i называются частотами . Процедура подсчета частот называется группировкой данных.

Объем выборки n равен сумме всех частот n i :

Относительной частотой значения x i называется отношение частоты этого значения n i к объему выборки n :

. (2)

Статистическим распределением частот (или просто распределением частот ) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:

Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.

1. Основные статистические характеристики.

Современные электронные таблицы имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встраиваются в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительные подпрограммы. В частности, в Excel, такая подпрограмма называется Пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета анализа в электронной таблице Excel.

Среднее значение.

Функция СРЗНАЧ вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).

Дисперсия и среднее квадратическое отклонение.

Для оценки разброса данных используются такие статистические характеристики, как дисперсия D и среднее квадратическое (или стандартное) отклонение . Стандартное отклонение есть квадратный корень из дисперсии:
. Большое стандартное отклонение указывает на то, что значения измерения сильно разбросаны относительно среднего, а малое – на то, что значения сосредоточены около среднего.

В Excel имеются функции, отдельно вычисляющие выборочную дисперсиюD в и стандартное отклонение в и генеральные дисперсиюD г и стандартное отклонение г. Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной. В зависимости от этого нужно использовать для расчетаD г и г,D в и в .

Для вычисления выборочной дисперсии D в и выборочного стандартного отклонения в имеются функции ДИСП) и СТАНДОТКЛОН. Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП (В1:В48).

Для вычисления генеральной дисперсии D г и генерального стандартного отклонения г имеются функции ДИСПР и СТАНДОТКЛОНП, соответственно.

Аргументы этих функций такие же как и для выборочной дисперсии.

Объем совокупности.

Объем совокупности выборочной или генеральной – это число элементов совокупности. Функция СЧЕТ определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).

Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.

Мода и медиана.

Мода – это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА. Ее аргументом является интервал ячеек с данными.

Медиана – это значение признака, которое разделяет совокупность на две равные по числу элементов части. Она вычисляется функцией МЕДИАНА. Ее аргументом является интервал ячеек.

Размах варьирования. Наибольшее и наименьшее значения.

Размах варьирования R – это разность между наибольшимx max и наименьшим x min значениями признака совокупности (генеральной или выборочной):R =x max –x min . Для нахождения наибольшего значенияx max имеется функция МАКС (или MAX), а для наименьшегоx min – функция МИН (или MIN). Их аргументом является интервал ячеек. Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу: =МАКС (А1:А100)-МИН (А1:А100).

Отклонение случайного распределения от нормального.

Нормально распределенные случайные величины широко распространены на практике, например, результаты измерения любой физической величины подчиняются нормальному закону распределения. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью

,

где
дисперсия, - среднее значение случайной величины .

Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцессЕ . Для нормального распределенияА =0 иЕ =0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А >0, то большая часть данных имеет значения, превышающие среднее ; еслиА <0, то большая часть данных имеет значения, меньшие среднего . Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Эксцесс оценивает «крутость», т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е >0, то максимум экспериментального распределения выше нормального; еслиЕ <0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100).

Задание 1. Применение статистических функций

Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.Найдите выборочные среднюю, дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.

    Наберите результаты эксперимента в столбец А.

    В ячейку В1 наберите «Среднее», в В2 – «выборочная дисперсия», в В3 – «стандартное отклонение», в В4 – «Максимум», в В5 – «Минимум», в В6 – « Размах варьирования», в В7 – «Мода», в В8 – «Медиана», в В9 – «Асимметрия», в В10 – «Эксцесс». Выровняйте ширину этого столбца с помощью Автоподбора ширины.

    Выделите ячейку С1 и нажмите на знак «=» в строке формул. С помощью Мастера функций в категорииСтатистические найдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмитеEnter .

    Выделите ячейку С2 и нажмите на знак «=» в строке формул. С помощью помощью Мастера функций в категорииСтатистические найдите функцию ДИСП, затем выделите интервал ячеек с данными и нажмитеEnter .

    Проделайте самостоятельно аналогичные действия для вычисления стандартного отклонения, максимума, минимума, моды, медианы, асимметрии и эксцесса.

    Для вычисления размаха варьирования в ячейку С6 следует ввести формулу: =МАКС (А1:А25)-МИН(А1:А25).