Данные для проведения статистических видов анализа. Основы статистического анализа данных
Достаточно часто возникают явления, которые можно проанализировать исключительно при помощи статистических методов. В этой связи для каждого субъекта, стремящегося глубоко изучить проблему, проникнуть в суть темы, важно иметь представление о них. В статье разберемся, что такое статистический анализ данных, каковы его особенности, а также какие методы применяют при его проведении.
Особенности терминологии
Статистику рассматривают в качестве специфичной науки, системы госорганов, а также как набор цифр. Между тем далеко не все цифры можно считать статистикой. Разберемся в этом вопросе.
Для начала следует вспомнить, что слово "статистика" имеет латинские корни и происходит от понятия status. В буквальном переводе термин означает "определенное положение предметов, вещей". Следовательно, статистическими признаются только такие данные, с помощью которых фиксируются относительно устойчивые явления. Анализ, собственно, и выявляет эту устойчивость. Его используют, к примеру, при изучении социально-экономических, политических явлений.
Назначение
Применение статистического анализа позволяет отображать количественные показатели в неразрывной связи с качественными. В результате исследователь может увидеть взаимодействие фактов, установить закономерности, выявить типичные признаки ситуаций, сценарии развития, обосновать прогноз.
Статистический анализ - это один из ключевых инструментов СМИ. Чаще всего его используют в деловых изданиях, таких как, например, "Ведомости", "Коммерсант", "Эксперт-профи" и пр. В них всегда публикуются "аналитические рассуждения" о валютном курсе, котировке акций, учетных ставках, инвестициях, рынке, экономике в целом.
Разумеется, чтобы результаты анализа были достоверными, постоянно проводится сбор данных.
Источники информации
Сбор данных может осуществляться по-разному. Главное, чтобы способы не нарушали закон и не ущемляли интересы других лиц. Если говорить о СМИ, то для них ключевыми источниками информации выступают государственные статистические органы. Эти структуры должны:
- Собирать отчетные сведения в соответствии с утвержденными программами.
- Группировать информацию по тем или иным критериям, наиболее значимым для исследуемого явления, формировать сводки.
- Проводить собственный статистический анализ.
В задачи уполномоченных госорганов входит также предоставление полученных ими данных в отчетах, тематических подборках или пресс-релизах. В последнее время статистика публикуется на официальных сайтах госструктур.
Кроме указанных органов, информацию можно получить в Едином госреестре предприятий, учреждений, объединений и организаций. Цель его создания состоит в формировании единой информационной базы.
Для проведения анализа можно использовать информацию, полученную от межправительственных организаций. Существуют специальные базы данных экономической статистики стран.
Часто информация поступает от частных лиц, общественных организаций. Эти субъекты обычно ведут свою статистику. Так, к примеру, Союз охраны птиц в России регулярно устраивает так называемые соловьиные вечера. В конце мая через СМИ организация приглашает всех желающих поучаствовать в подсчете соловьев на территории Москвы. Полученные сведения обрабатываются группой экспертов. После этого сведения переносятся в специальную карту.
Многие журналисты обращаются за информацией к представителям других авторитетных СМИ, пользующихся у аудитории популярностью. Распространенным способом получения данных является опрос. При этом опрашиваемыми могут стать как рядовые граждане, так и эксперты в какой-либо области.
Специфика выбора методики
Перечень показателей, необходимых для проведения анализа, зависит от специфики исследуемого явления. К примеру, если изучается уровень благосостояния населения, приоритетными считаются данные о качестве жизни граждан, прожиточном минимуме на данной территории, размере МРОТ, пенсии, стипендии, потребительской корзины. При исследовании демографической ситуации важны показатели смертности и рождаемости, число мигрантов. Если изучается сфера промышленного производства, важные сведения для статистического анализа - это количество предприятий, их виды, объем продукции, уровень производительности труда и т. д.
Средние показатели
Как правило, при описании тех или иных явлений используются средние арифметические величины. Для их получения числа складывают друг с другом, а полученный результат делят на их количество.
Например, установлено, что в один госорган приходит 5 тысяч писем ежемесячно, а в другой - 1 000. Выходит, что первая структура получает в 5 раз больше обращений. При сравнении средних показателей может быть выражена в процентах. К примеру, средний заработок фармацевта составляет 70 % от ср. з/п инженера.
Итоговые сводки
Они представляют собой систематизацию признаков исследуемого события для выявления динамики его развития. К примеру, установлено, что в 1997 г. речной транспорт всех ведомств и управлений перевез 52,4 млн тонн груза, а в 2007 г. - 101,2 млн т. Чтобы понять изменения характера транспортировок за период с 1997 по 2007 г., можно сгруппировать итоговые показатели по видам объектов, а затем сравнить группы друг с другом. В итоге можно получить более полные сведения о развитии грузооборота.
Индексы
Их достаточно широко применяют при исследовании динамики событий. Индекс в статистическом анализе - это средний показатель, отражающий изменение явления под воздействием другого события, абсолютные показатели которого признаны неизменными.
К примеру, в демографии в качестве специфического индекса может выступать величина естественной убыли (прироста) населения. Ее определяют при сравнении уровня рождаемости и смертности.
Графики
Они используются для отображения динамики развития события. Для этого применяют фигуры, точки, линии, имеющие условные значения. Графики, с помощью которых выражаются количественные соотношения, именуются диаграммами или динамическими кривыми. Благодаря им можно наглядно увидеть динамику развития какого-то явления.
График, показывающий увеличение количества лиц, страдающих остеохондрозом, представляет собой кривую, уходящую вверх. Соответственно, по ней можно наглядно увидеть тенденцию заболеваемости. Люди, даже не прочитав текстовый материал, могут сформулировать выводы о сложившейся динамике и спрогнозировать развитие ситуации в дальнейшем.
Статистические таблицы
Они очень часто используются для отражения данных. С помощью статистических таблиц можно сопоставлять информацию по изменяющимся со временем показателям, различающимся в зависимости от страны и пр. Они представляют собой наглядную статистику, которой зачастую не нужны комментарии.
Методы
В основе статистического анализа лежат приемы и способы сбора, обработки и обобщения сведений. В зависимости от природы методы могут быть количественными и категориальными.
При помощи первых получают метрические данные, которые по своей структуре являются непрерывными. Их можно измерить при помощи интервальной шкалы. Она представляет собой систему чисел, равные промежутки между которыми отражают периодичность значений изучаемых показателей. Также используется шкала отношений. В ней, кроме расстояния, определяется также порядок значений.
Неметрические (категориальные) данные представляют собой качественные сведения, количество уникальных категорий и значений которых ограничено. Они могут быть представлены в виде номинальных или порядковых показателей. Первые используют для нумерации объектов. Для вторых предусматривается естественный порядок.
Одномерные методы
Они применяются в том случае, если для оценки всех элементов выборки используется единый измеритель или если последних несколько для каждого компонента, но переменные исследуются обособленно друг от друга.
Одномерные методы различаются в зависимости от типа данных: метрические или неметрические. Первые измеряют по относительной или интервальной шкале, вторые - по номинальной или порядковой. Кроме этого, деление методов осуществляется на классы в зависимости от количества исследуемых выборок. При этом необходимо учитывать, что это число определяют по тому, как осуществляется работа с информацией для конкретного анализа, а не по способу сбора данных.
Однофакторное дисперсионное исследование
Цель статистического анализа может состоять в изучении воздействия одного либо нескольких факторов на конкретный признак объекта. Однофакторный дисперсионный метод применяется тогда, когда у исследователя есть 3 и больше независимые выборки. При этом они должны быть получены из генеральной совокупности посредством изменения независимого фактора, для которого отсутствуют количественные измерения по каким-то причинам. Предполагается, что имеются различные и одинаковые выборочные дисперсии. В этой связи следует определить, оказал ли данный фактор значительное влияние на разброс или он стал следствием случайностей, возникших вследствие небольших объемов выборок.
Вариационный ряд
Он представляет собой упорядоченное распределение единиц генеральной совокупности, как правило, по возрастающим (в редких случаях по убывающим) показателям признака и подсчет их числа с тем или другим значением признака.
Вариация является различием в показателе какого-либо признака у различных единиц конкретной совокупности, возникающим в один и тот же момент либо период. К примеру, сотрудники компании отличаются друг от друга по возрасту, росту, доходам, весу и пр. Возникает вариация вследствие того, что индивидуальные показатели признака формируются под комплексным влиянием разных факторов. В каждом конкретном случае они сочетаются по-разному.
Вариационный ряд бывает:
- Ранжированным. Он представлен в виде перечня отдельных единиц генеральной совокупности, расположенных в порядке убывания либо возрастания исследуемого признака.
- Дискретным. Он представлен в форме таблицы, включающей в себя конкретные показатели изменяющегося признака х и количества единиц совокупности с заданной величиной f признака частот.
- Интервальным. В этом случае показатель непрерывного признака задается с помощью интервалов. Они характеризуются частотой t.
Многомерный статистический анализ
Он проводится, если для оценки элементов выборки применяется 2 и более измерителя, и переменные изучаются одновременно. Такая форма статистического анализа отличается от одномерного способа в первую очередь тем, что при ее использовании внимание сосредотачивается на уровне взаимосвязи между явлениями, а не на средних показателях и распределениях (дисперсиях).
Среди основных методов многомерного статистического исследования выделяют:
- Кросс-табуляцию. С ее использованием одновременно характеризуют значение двух и более переменных.
- Дисперсионный статистический анализ. Этот метод ориентирован на поиск зависимостей среди экспериментальных данных посредством изучения существенности различий в средних показателях.
- Ковариационный анализ. Он тесно связан с дисперсионным методом. При ковариационном исследовании зависимая переменная корректируется в соответствии с информацией, связанной с ней. Это обеспечивает возможность устранения изменчивости, вносимой извне, и, соответственно, повысить эффективность исследования.
Также существует дискриминантный анализ. Он применяется, если зависимая переменная является категориальной, а независимые (предикторы) - интервальными.
Достаточно подробно изложены в отечественной литературе. В практике российских предприятий, между тем, используются только некоторые из них. Рассмотрим далее некоторые методы статистической обработки.
Общие сведения
В практике отечественных предприятий распространены преимущественно статистические методы контроля . Если говорить о регулировании технологического процесса, то оно отмечается крайне редко. Применение статистических методов предусматривает, что на предприятии формируется группа из специалистов, которые имеют соответствующую квалификацию.
Значение
Согласно требованиям ИСО сер. 9000, поставщику необходимо определить необходимость в статистических методах, которые применяются в процессе разработки, регулирования и проверки возможностей производственного процесса и характеристики изделий. Используемые приемы базируются на теории вероятностей и математических расчетах. Статистические методы анализа данных могут внедряться на любом этапе жизненного цикла изделия. Они обеспечивают оценку и учет степени неоднородности продукции либо вариабельности ее свойств относительно установленных номиналов или требуемых значений, а также изменчивости процесса ее создания. Статистические методы - это приемы, посредством которых можно с заданной точностью и достоверностью судить о состоянии явлений, которые исследуются. Они позволяют спрогнозировать те или иные проблемы, выработать оптимальные решения на основе изученной фактической информации, тенденциях и закономерностях.
Направления использования
Основные области, в которых широко распространены статистические методы, - это :
Практика развитых стран
Статистические методы - это база, обеспечивающая создание продукции с высокими потребительскими характеристиками. Эти приемы широко используются в промышленно развитых государствах. Статистические методы - это, по сути, гаранты получения потребителями продукции, соответствующей установленным требованиям. Эффект их использования доказан практикой промышленных предприятий Японии. Именно они способствовали достижению высочайшего производственного уровня в этой стране. Многолетний опыт зарубежных стран показывает, насколько эффективны эти приемы. В частности, известно, что компания Hewlelt Packard, применяя статистические методы, смогла снизить в одном из случаев количество брака за месяц с 9 000 до 45 ед.
Сложности внедрения
В отечественной практике существует ряд препятствий, не позволяющих использовать статистические методы изучения показателей. Сложности возникают вследствие:
Разработка программы
Необходимо сказать, что определение потребности в тех или иных статистических методах в сфере качества, выбор, освоение конкретных приемов является довольно сложной и длительной работой для любого отечественного предприятия. Для эффективного ее осуществления целесообразно разработать специальную долговременную программу. В ней следует предусмотреть формирование службы, в задачи которой будет входить организация и методическое руководство применения статистических методов. В рамках программы нужно предусмотреть оснащение соответствующими техническими средствами, обучение специалистов, определить состав производственных задач, которые должны решаться с помощью выбранных приемов. Освоение рекомендуется начать с использования самых простых подходов. К примеру, можно использовать известные элементарные производством. Впоследствии целесообразно перейти к другим приемам. Например, это может быть анализ дисперсии, выборочная обработка информации, регулирование процессов, планирование факторного исследования и экспериментов и пр.
Классификация
К статистическим методам экономического анализа относятся разные приемы. Стоит сказать, их насчитывается довольно много. Однако ведущий специалист в сфере менеджмента качества в Японии К. Исикава рекомендует использовать семь основных методов:
- Диаграммы Парето.
- Группировка сведений по общим признакам.
- Контрольные карты.
- Причинно-следственные диаграммы.
- Гистограммы.
- Контрольные листки.
- Диаграммы разброса.
Руководствуясь собственным опытом в сфере менеджмента, Исикава утверждает, что 95% всех вопросов и проблем на предприятии можно решить, используя эти семь подходов.
Диаграмма Парето
Этот базируется на определенном соотношении. Оно было названо "принципом Парето". В соответствии с ним, из 20% причин появляется 80% следствий. в наглядной и понятной форме показывает относительное влияние каждого обстоятельства на общую проблему в убывающем порядке. Это воздействие можно исследовать на количестве потерь, дефектов, спровоцированных каждой причиной. Относительное влияние иллюстрируется с помощью столбиков, накопленное воздействие факторов посредством кумулятивной прямой.
Причинно-следственная диаграмма
На ней исследуемую проблему условно изображают в форме горизонтальной прямой стрелки, а условия и факторы, косвенно либо прямо влияющие на нее, - в виде наклонных. При построении следует учитывать даже незначительные на первый взгляд обстоятельства. Это обуславливается тем, что на практике достаточно часто бывают случаи, в которых решение задачи обеспечивается исключением нескольких, кажущихся несущественными, факторов. Причины, которые влияют на основные обстоятельства (первого и следующих порядков) изображают на диаграмме горизонтальными короткими стрелками. Детализированная схема будет иметь форму скелета рыбы.
Группировка сведений
Этот экономико-статистический метод используется для упорядочения множества показателей, которые были получены при оценке и измерении одного или нескольких параметров объекта. Как правило, такая информация представлена в форме неупорядоченной последовательности значений. Это могут быть линейные размеры заготовки, температура плавления, твердость материала, количество дефектов и так далее. На основе такой системы сложно делать выводы о свойствах изделия либо процессах его создания. Упорядочивание осуществляется с помощью линейных графиков. Они наглядно показывают изменения наблюдаемых параметров в течение определенного периода.
Контрольный листок
Как правило, он представлен в виде таблицы распределения частот вхождения измеряемых величин параметров объекта в соответствующие промежутки. Контрольные листки составляются в зависимости от поставленной цели исследования. Диапазон значений показателей разделяется на одинаковые интервалы. Их число выбирают обычно равное квадратному корню из количества выполненных измерений. Бланк должен быть простым, чтобы исключить проблемы при заполнении, прочтении, проверке.
Гистограмма
Она представлена в форме ступенчатого многоугольника. Он наглядно иллюстрирует распределение показателей измерений. Диапазон установленных величин разбивается на равные промежутки, которые откладывают по оси абсцисс. К каждому интервалу строится прямоугольник. Его высота равна частоте вхождения величины в данный промежуток.
Диаграммы разброса
Они используются при проверке гипотезы о взаимосвязи двух переменных величин. Модель строится следующим образом. На оси абсцисс откладывают величину одного параметра, ординат - другого показателя. В результате на графике появляется точка. Данные действия повторяются для всех значений переменных. При наличии взаимосвязи поле корреляции вытянуто, и направление не будет совпадать с направленностью оси ординат. Если зависимость отсутствует, оно параллельно одной из осей или будет иметь форму круга.
Контрольные карты
Они используются при оценке процесса в течение конкретного периода. Формирование контрольных карт базируется на следующих положениях:
- Все процессы отклоняются от заданных параметров с течением времени.
- Нестабильный ход явления не изменяются случайно. Неслучайными выступают отклонения, выходящие за границы предполагаемых пределов.
- Отдельные изменения могут быть спрогнозированы.
- Стабильный процесс может случайно отклоняться и в предполагаемых границах.
Использование в практике российских предприятий
Следует сказать, что отечественный и зарубежный опыт показывает, что наиболее эффективным статистическим методом оценки стабильности и точности оборудования и технологических процессов выступает составление контрольных карт. Этот способ используется также при регулировании производственных потенциальных мощностей. При построении карт необходимо правильно выбрать исследуемый параметр. Рекомендуется отдавать предпочтение тем показателям, которые непосредственно относятся к назначению изделия, могут быть легко измерены и на которые можно оказать воздействие посредством регулирования процесса. Если такой выбор затруднителен или не оправдан, можно выполнить оценку величин, коррелированных (взаимосвязанных) с контролируемым параметром.
Нюансы
Если измерение показателей с точностью, требуемой для составления карт по количественному критерию, экономически или технически невозможно, используют альтернативный признак. С ним связаны такие термины, как "брак" и "дефект". Под последним понимают каждое обособленное несоответствие изделия установленным требованиям. Браком называют продукцию, предоставление которой не допускается потребителям, в связи с наличием в ней дефектов.
Особенности
У каждого типа карт есть своя специфика. Ее необходимо принимать во внимание при их выборе для конкретного случая. Карты по количественному критерию считаются более чувствительными к изменениям процесса, чем те, в которых используется альтернативный признак. Однако при этом первые более трудоемки. Их используют для:
- Отладки процесса.
- Оценки возможностей внедрения технологии.
- Проверки точности работы оборудования.
- Определения допусков.
- Сопоставления нескольких допустимых способов создания продукта.
Дополнительно
Если разладка процесса отличается смещением контролируемого параметра, необходимо использовать Х-карты. Если имеет место увеличение рассеяния значений, выбирать нужно R или S-модели. Необходимо, однако, учитывать ряд особенностей. В частности, использование S-карт позволит точнее и быстрее установить разладку процесса, чем R-модели при одинаковых Вместе с тем, построение последних не требует выполнения сложных расчетов.
Заключение
В экономике позволяют исследовать факторы, которые обнаруживаются в ходе качественной оценки, в пространстве и динамике. С их помощью можно выполнять прогнозные расчеты. К статистическим методам экономическая анализа не относят способы оценки причинно-следственных связей хозяйственных процессов и событий, выявления перспективных и неиспользованных резервов повышения результативности деятельности. Другими словами, в число рассмотренных подходов не включаются факторные приемы.
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
- 3. Ряды динамики
- Литература
1. Абсолютные и относительные величины
В результате сводки и группировки статистического материала в руках исследователя оказывается самая разнообразная информация об изучаемых явлениях и процессах. Однако, останавливаться на полученных результатах было бы большой ошибкой, потому что, даже сгруппированные по заданным признакам и отраженные в табличной или графической форме, эти данные пока являются только своего рода иллюстрацией, промежуточным результатом, который должен быть подвергнут анализу - в данном случае, статистическому. Статистический анализ - это представление изучаемого объекта в качестве расчлененной системы, т.е. комплекса элементов и связей, образующих в своем взаимодействии органическое целое .
В результате такого анализа должна быть построена модель изучаемого объекта, причем, поскольку речь идет о статистике, при построении модели должны быть использованы статистические значимые элементы и связи.
Собственно, на выявление таких значимых элементов и связей и направлен статистический анализ.
Абсолютные показатели (величины) - величины суммарные, подсчитанные или взятые из сводных статистических отчетов без всяких преобразований. Абсолютные показатели всегда именные и отражаются в тех единицах измерения, которые были заданы при составлении программы статистического наблюдения (количество возбужденных уголовных дел, количество совершенных преступлений, количество разводов и т.д.).
Абсолютные показатели являются базовыми для любых дальнейших статистических операций, однако сами они для анализа малопригодны. По абсолютным показателям, например, трудно судить об уровне преступности в разных городах или регионах и практически нельзя ответить на вопрос, где преступность выше, а где ниже, так как города или регионы могут существенно различаться численности населения, территории и другим важным параметрам.
Относительные величины в статистике представляют собой обобщающие показатели, которые раскрывают числовую форму соотношения двух сопоставляемых статистических величин. При исчислении относительных величин наиболее часто сравнивают две абсолютные, но можно сопоставлять и средние, и относительные величины, получая новые относительные показатели. Самый простой пример вычисления относительной величины - ответ на вопрос: во сколько раз одно число больше другого?
Приступая к рассмотрению относительных величин, необходимо учитывать следующее. В принципе, сравнивать можно все, что угодно, даже линейные размеры листа бумаги А4 с количеством продукции, выпускаемой Ломоносовским фарфоровым заводом. Однако, такое сравнение ничего нам не даст. Важнейшее условие для плодотворного вычисления относительных величин можно сформулировать следующим образом:
1. единицы измерения сравниваемых величин должны быть одними и теми же или вполне сопоставимыми. Числа преступлений, уголовных дел и осужденных - показатели коррелируемые, т.е. взаимосвязанные, но не сопоставимые по единицам измерения. В одном уголовном деле может быть рассмотрено несколько преступлений и осуждена группа лиц; несколько осужденных могут совершить одно преступление и, наоборот, один осужденный - множество деяний. Числа преступлений, дел и осужденных сопоставимы с численностью населения, количеством персонала системы уголовной юстиции, уровнем жизни народа и другими данными одного и того же года. Более того, в течение одного года рассматриваемые показатели вполне сопоставимы и между собой.
2. Сопоставляемые данные обязательно должны соответствовать друг другу по времени или территории их получения либо по тому и другому параметрам вместе.
Абсолютная величина, с которой сравниваются другие в е личины, называется основанием или базой сравнения, а сравн и ваемый показатель - величиной сравнения . Например, при расчете отношения динамики преступности в России в 2000-2010 гг. данные 2000 г. будут базовыми. Они могут приниматься за единицу (тогда относительная величина будет выражена в форме коэффициента), за 100 (в процентах). В зависимости от размерности сравниваемых величин выбирают наиболее удобную, показательную и наглядную форму выражения относительной величины.
Если сравниваемая величина намного превосходит основание, получаемое отношение лучше выразить в коэффициентах. Например, преступность за определённый период (в годах) увеличилась в 2,6 раза. Выражение в разах в данном случае будет показательнее, чем в процентах. В процентах относительные величины выражаются тогда, когда величина сравнения не сильно отличается от базы.
Относительные величины, применяемые в статистике, в том числе и правовой, бывают разных видов. В правовой статистике применяются следующие виды относительных величин:
1. отношения, характеризующие структуру совокупности, или отношения распределения;
2. отношения части к целому, или отношения интенсивности;
3. отношения, характеризующие динамику;
4. отношения степени и сравнения.
Относительная величина распределения - это относительная величина, выражаемая в процентах отдельных частей совокупности изученных явлений (преступлений, преступников, гражданских дел, исков, причин, мер предупреждения и т.д.) к их общему итогу, принимаемому за 100% . Это - самый распространенный (и простой) вид относительных данных, применяемых в статистике. Это, например, структура преступности (по видам преступлений), структура судимости (по видам преступлений, по возрасту осужденных) и т.д.
статистический анализ абсолютная величина
Отношение интенсивности (отношение части к целому) - обобщающая относительная величина, которая отражает распространенность определенного признака в наблюдаемой совокупности.
Самый распространенный показатель интенсивности, применяемый в правовой статистике - интенсивности преступности. Интенсивность преступности обычно отражается посредством коэффициента преступности, т.е. числа преступлений на 100 или 10 тыс. жителей.
КП= (П*100000)/Н
где П - абсолютное число учтенных преступлений, Н - абсолютная численность населения.
Обязательное условие, определяющее саму возможность вычисления таких показателей, как было сказано выше - все используемые абсолютные показатели берутся на одной территории и за один промежуток времени.
Отношения, характеризующие динамику , представляют собой обобщающие относительные величины, показывающие изменение во времени тех или иных показателей правовой статистики . За временной интервал обычно принимается год.
За основание (базу), равное 1, или 100%, принимаются сведения об изучаемом признаке определенного года, который был чем-то характерен для изучаемого явления. Данные базового года выполняют роль неподвижной базы, к которой процентируются показатели последующих лет.
Задачи статистического анализа часто требуют ежегодных (или по иным периодам) сопоставлений, когда за базу принимаются данные каждого предыдущего года (месяца или другого периода). Подобная база называется подвижной . Обычно это используется при анализе временных рядов (рядов динамики).
Отношения степени и сравнения позволяют сопоставлять различные показатели в целях выявления, какая величина насколько больше другой, в какой мере одно явление отличается от другого или схоже с ним, что имеется общего и отличительно в наблюдаемых статистических процессах и т.д.
Индекс - это специально созданный относительный показатель сравнения (во времени, пространстве, при сравнении с прогнозом и т.д.), показывающий, во сколько раз уровень изучаемого явления в одних условиях отличается от уровня того же явления в других условиях. Наиболее распространены индексы в экономической статистике, хотя они играют определенную роль и при анализе правовых явлений.
Без индексов не обойтись в случаях, когда необходимо сопоставить несоизмеримые показатели, простое суммирование которых невозможно. Поэтому обычно индексы определяют как числа-показатели для измерения средней динамики совокупности разнородных элементов .
В статистике индексы обычно обозначают буквой I (i). Прописная буква или заглавная - зависит от того, идет ли речь об индивидуальном (частном) индексе или он общем.
Индивидуальные индексы (i) отражают отношение показателя текущего периода к соответствующему показателю сравниваемого периода.
Сводные индексы используются при анализе соотношения сложных социально-экономических явлений и состоят из двух частей: собственно индексируемой величины и соизмерителя ("веса").
2. Средние величины и их применение в правовой статистике
Результатом обработки абсолютных и относительных показателей является построение рядов распределения. Ряд распределения - это упорядоченные по качественным или количественным признакам распределения единиц совокупности . Анализ этих рядов лежит в основе любого статистического анализа, каким бы сложным в дальнейшем он не оказался.
Ряд распределения может быть построен на основании качественных или количественных признаков. В первом случае он называется атрибутивным , во втором - вариационным . При этом различия количественного признака называется вариацией , а сам этот признак - вариантой . Именно с вариационными рядами чаще всего приходится иметь дело правовой статистике.
Вариационный ряд всегда состоит из двух колонок (граф). В одной указывается значение количественного признака в порядке возрастания, которые, собственно, и называют вариантами, которые обозначаются x . В другой колонке (графе) указывается число единиц, которые свойственны той или иной варианте. Они называются частотами и обозначаются латинской буквой f .
Таблица 2.1
Варианта x |
|||||
Частота f |
Частота проявления того или иного признака очень важна при вычислении других значимых статистических показателей, а именно - средних и показателей вариации.
Вариационные ряды, в свою очередь, могут быть дискретными или интервальными . Дискретные ряды, как следует из названия, построены на основании дискретно варьирующих признаков, а интервальными - на основании непрерывных вариаций. Так, например, распределение правонарушителей по возрасту может быть как дискретным (18, 19,20 лет и т.д.), так и непрерывным (до 18 лет, 18-25 лет, 25-30 лет и т.д.). Причем сами интервальные ряды могут строиться как по дискретному, так и по непрерывному принципу. В первом случае границы смежных интервалов не повторяются; в нашем примере интервалы будут выглядеть так: до 18 лет, 18-25, 26-30, 31-35 и т.д. Такой ряд называется непрерывный дискретный ряд . Интервальный ряд с непрерывной вариацией предполагает совпадение верхней границы предыдущего интервала с нижней границей последующей.
Самый первый показатель, описывающий вариационные ряды - это средние величины . Они играют важную роль в правовой статистике, поскольку только с их помощью можно охарактеризовать совокупности по количественному варьирующему признаку, по которому можно их сравнивать. С помощью средних величин можно сравнивать интересующие нас совокупности юридически значимых явлений по тем или иным количественным признакам и делать из этих сравнений необходимые выводы.
Средние величины отражают самую общую тенденцию (закономерность ), присущую всей массе изучаемых явлений. Она проявляется в типичной количественной характеристике, т.е. в средней величине всех имеющихся (варьирующих) показателей.
Статистикой разработано много видов средних величин: средняя арифметическая, геометрическая, кубическая, гармоническая и т.д. Однако в правовой статистике они практически не применяются, поэтому мы будем рассматривать только два вида средние - среднюю арифметическую и среднюю геометрическую.
Самая распространенная и хорошо известная средняя - это средняя арифметическая . Для ее расчета высчитывается сумма показателей и делится на общее число показателей. Например, семья из 4-х человек состоит из родителей возрастом 38 и 40 лет и двоих детей возрастом 7год и 10 лет. Мы суммируем возраст: 38+40+7+10 и полученную сумму 95 делим на 4. Полученный средний возраст семьи - 23,75 года. Или рассчитаем среднемесячную нагрузку следователей, если в отделе из 8 человек за месяц раскрыто 25 дел. Делим 25 на 8 и получаем 3,125 дела в месяц на следователя.
В правовой статистике средняя арифметическая используется при расчете нагрузки сотрудников (следователей, прокуроров, судей и т.д.), расчете абсолютного прироста преступности, расчете выборки и т.д.
Однако в приведенным примере среднемесячная нагрузка на следователя рассчитана неверно. Дело в том, что простая средняя арифметическая не учитывает частоту изучаемого признака. В нашем примере среднемесячная нагрузка на следователя столь же корректна и информативна, как "средняя температура по больнице" из известного анекдота, которая, как известно, комнатная. Для того, чтобы при расчете средней арифметической учитывать частоту проявлений изучаемого признака, используется так средняя арифметическая взвешенная илисредняя для дискретных вариационных рядов. (Дискретный вариационный ряд - последовательность изменения признака по дискретным (прерывистым) показателям).
Средняя арифметическая взвешенная (средняя взвешенная) не имеет принципиальных отличий от простой средней арифметической. В ней суммирование одного и того же значения заменено умножением этого значения на его частоту, т.е. в этом случае каждое значение (варианта) взвешивается по частоте встречаемости.
Так, вычисляя по среднюю нагрузку следователей, мы должны умножим число дел на число следователей, который расследовали именно такое количество дел. Обычно такие расчеты удобно представлять в виде таблиц:
Таблица 2.2
Число дел (варианта х ) |
Число следователей (частота f ) |
Произведение вариант на частоты (х f ) |
|
2. Вычислим собственно среднюю взвешенную по формуле:
где x - число уголовных дел, а f - число следователей.
Таким образом, средняя взвешенная равна не 3,125, а 4,375. Если вдуматься, то так и должно быть: нагрузка на каждого отдельного следователя возрастает за счет того, что один следователь в нашем гипотетическом отделе оказался бездельником - или, наоборот, расследовал особо важное и сложное дело. Но вопрос интерпретации результатов статистического исследования будет рассматриваться в следующей теме. В некоторых случаях, а именно - в случаях сгруппированных частот дискретного распределения - вычисление средней, на первый взгляд, неочевидно. Предположим, нам необходимо вычислить среднюю арифметическую для распределения лиц, осужденных за хулиганство, по возрасту. Распределение выглядит следующим образом:
Таблица 2.3
(варианта х ) |
Число осужденных (частота f ) |
Середина интервала |
Произведение вариант на частоты (х f ) |
|
(21-18) /2+18=19,5 |
||||
Далее средняя высчитывается по общему правилу и составляет для данного дискретного ряда 23,6 года. В случае т. н. открытых рядов, то есть в ситуациях, когда крайние интервалы определяются "менее x " или "больше x ", величина крайних интервалов задается аналогично другим интервалам.
3. Ряды динамики
Общественные явления, изучаемые статистикой, находятся в постоянном развитии и изменении. Социально-правовые показатели могут быть представлены не только в статической форме, отражающей определенное явление, но и как процесс, происходящий во времени и пространстве, а также в виде взаимодействия исследуемых признаков. Иными словами, динамические ряды показывают развитие признака, т.е. его изменение во времени, пространстве или в зависимости от условий среды.
Данный ряд представляет собой последовательность средних величин в указанные периоды времени (за каждый календарный год).
Для более глубокого изучения общественных явлений и их анализа простого сопоставления уровней ряда динамики недостаточно, необходимо исчислять производные показатели ряда динамики: абсолютный прирост, темп роста, темп прироста, средние темпы роста и прироста, абсолютное содержание одного процента прироста.
Расчет показателей рядов динамики осуществляется на основе сравнения их уровней. При этом возможны два способа сопоставления уровней динамического ряда:
базисные показатели, когда все последующие уровни сравнивают с некоторым начальным, принятым за базу;
цепные показатели, когда каждый последующий уровень ряда динамики сопоставляют с предыдущим.
Абсолютный прирост показывает, на сколько единиц уровень текущего периода больше или меньше уровня базисного или предыдущего периода за конкретный промежуток времени.
Абсолютный прирост (П) исчисляется как разность между сравниваемыми уровнями.
Базисный абсолютный прирост:
П б = y i - y баз . (ф.1).
Цепной абсолютный прирост:
П ц = y i - y i -1 (ф.2).
Темп роста (Тр) показывает, во сколько раз (на сколько процентов) уровень текущего периода больше или меньше уровня базисного или предыдущего периода:
Базисный темп роста:
(ф.3)
Цепной темп роста:
(ф.4)
Темп прироста (Тпр) показывает, на сколько процентов уровень текущего периода больше или меньше уровня базисного или предыдущего периода, принятого за базу сравнения, и вычисляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу.
Темп прироста можно также рассчитать путем вычитания из темпа роста 100%.
Базисный темп прироста:
или (ф.5)
Цепной темп прироста:
или (ф.6)
Средний темп роста исчисляется по формуле средней геометрической из темпов роста ряда динамики:
(ф.7)
где - средний темп роста;
- темпы роста для отдельных периодов;
n - число темпов роста.
Подобные задачи с показателем корня больше трех, как правило, решаются при помощи логарифмирования. Из алгебры известно, что логарифм корня равен логарифму подкоренной величины, деленной на показатель корня, и что логарифм произведения нескольких сомножителей равен сумме логарифмов этих сомножителей.
Таким образом, средние темпы роста исчисляются путем извлечения корня n степени из произведений индивидуальных n - цепных темпов роста. Средние темпы прироста представляют собой разность между средним темпом роста и единицей (), или 100%, когда темп роста выражен в процентах:
или
При отсутствии в динамическом ряду промежуточных уровней средние темпы роста и прироста определяются по следующей формуле:
(ф.8)
где - конечный уровень динамического ряда;
- начальный уровень динамического ряда;
n - число уровней (дат).
Очевидно, что показатели средних темпов роста и прироста, исчисленные по формулам (ф.7 и ф.8), имеют одинаковые числовые значения.
Абсолютное содержание 1% прироста показывает, какое абсолютное значение содержит 1% прироста и исчисляется как отношение абсолютного прироста к темпу прироста.
Абсолютное содержание 1% прироста:
базисные: (ф.9)
цепные: (ф.10)
Вычисление и анализ абсолютного значения каждого процента прироста способствуют более глубокому пониманию характера развития исследуемого явления. Данные нашего примера показывают, что, несмотря на колебания темпов роста и прироста за отдельные годы, базисные показатели абсолютного содержания 1% прироста остаются неизменными, в то время как цепные показатели, характеризующие изменения абсолютного значения одного процента прироста в каждом последующем году по сравнению с предыдущим, непрерывно возрастают.
При построении, обработке и анализе рядов динамики часто возникает потребность в определении средних уровней изучаемых явлений за определенные промежутки времени. Средняя хронологическая интервального ряда исчисляется при равных интервалах по формуле средней арифметической простой, при неравных интервалах - по средней арифметической взвешенной:
где - средний уровень интервального ряда;
- исходные уровни ряда;
n - число уровней.
Для моментного ряда динамики при условии равенства промежутков времени между датами исчисление среднего уровня производится по формуле средней хронологической:
(ф.11)
где - средняя хронологическая величина;
y 1 ,., y n - абсолютный уровень ряда;
n - число абсолютных уровней ряда динамики.
Средняя хронологическая из уровней моментного ряда динамики равняется сумме показателей этого ряда, деленной на число показателей без одного; при этом начальный и конечный уровни должны быть взяты в половинном размере, так как число дат (моментов) обычно бывает наединицу больше, чем число периодов.
В зависимости от содержания и формы представления исходных данных (интервальные или моментные ряды динамики, равные или нет временные интервалы) для вычисления различных социальных показателей, например, среднегодовое количество преступлений и правонарушений (по видам), среднего размера остатков оборотных средств, среднесписочного числа правонарушителей и т.п., используют соответствующие аналитические выражения.
4. Статистические методы изучения взаимосвязей
В предыдущих вопросах мы рассматривали, если можно так сказать, анализ "одномерных" распределений - вариационных рядов. Это очень важный, но далеко не единственный вид статистического анализа. Анализ вариационных рядов является основанием для более "продвинутых" видов статистического анализа, в первую очередь - для изучения взаимосвязей . В результате такого исследования вскрываются причинно-следственные отношения между явлениями, что позволяет определить, изменении каких признаков влияет на вариации изучаемых явлений и процессов. При этом признаки, обуславливающие изменение других, называются факторными (факторами), а признаки, изменяющиеся под их воздействием - результативными.
В статистической науке различают два вида связей между различными признаками и их сведениями - функциональную связь (жестко-детерминированную) и статистическую (стохастическую).
Для функциональных связей характерно полное соответствие между изменением факторного признака и изменением результативной величины. Эта взаимосвязь одинаково проявляется у всех единиц любой совокупности. Самый простой пример: повышение температуры отражается на объеме ртути в градуснике. При этом температура окружающей среды выступает в качестве фактора, а объем ртути - в качестве результативного признака.
Функциональные взаимосвязи характерны для явлений, изучаемых такими науками, как химия, физика, механика, в которых есть возможность ставить "чистые" эксперименты, при которых устраняется влияние посторонних факторов. Дело в том, что функциональная связь между двумя возможна только в том случае, если вторая величина (результативный признак) зависит только и исключительно от первой. В общественных явлениях такое наблюдается крайне редко.
Социально-правовые процессы, представляющие собой результат одновременного воздействия большого количества факторов, описываются посредством статистических связей, то есть связей стохастически (случайно ) детерминированных , когда разным значениям одной переменной соответствуют разные значения другой переменной.
Наиболее важный (и распространенный) случай стохастической зависимости - корреляционная зависимость . При такой зависимости причина определяет следствие не однозначно, а лишь с определенной долей вероятности. Выявлению таких связей посвящен отдельный вид статистического анализа - корреляционный анализ.
Основная задача корреляционного анализа - на основе строго математических приемов установить количественное выражение зависимости, существующей между исследуемыми признаками. Существует несколько подходов к тому, как именно вычисляется корреляция и, соответственно, несколько видов коэффициентов корреляции: коэффициент сопряженности А.А. Чупрова (для измерения связи между качественнымипризнаками), коэффициент ассоциации К. Пирсона, а также коэффициенты ранговой корреляции Спирмена и Кендалла. В общем случае такие коэффициенты показывают, с какой вероятностью проявляются изучаемые взаимосвязи. Соответственно, чем коэффициент выше, тем более выраженной является связь между признаками.
Между изучаемыми факторами может существовать как прямая, так и обратная корреляционная зависимость. Прямая корреляционная зависимость наблюдается в случаях, когда изменению значений фактора соответствуют такие же изменения значения результативного признака, то есть, когда увеличивается значение факторного признака, увеличивается и значение результативного, и наоборот. Например, между криминогенными факторами и преступностью существует прямая корреляционная зависимость (со знаком "+"). Если же увеличение значений одного признака вызывает обратные изменения значений другого, то такая связь называется обратной . Например, чем выше социальный контроль в обществе, тем ниже преступность (связь со знаком "-").
И прямые, и обратные связи могут быть прямолинейными и криволинейными.
Прямолинейные (линейные) связи проявляются тогда, когда с увеличением значений признака-фактора происходит возрастание (прямая) или уменьшение (обратная) величины признака-следствия. Математически такая связь выражается уравнением регрессии: у = а + b х, где у - признак-следствие; а и b - соответствующие коэффициенты связи; х - признак-фактор.
Криволинейные связи носят иной характер. Возрастание величины факторного признака оказывает неравномерное влияние на величину результирующего признака. Вначале эта связь может быть прямой, а затем - обратной. Известный пример - связь преступлений с возрастом правонарушителей. Сначала криминальная активность лиц растет прямо пропорционально увеличению возраста правонарушителей (приблизительно до 30 лет), а затем с увеличением возраста преступная активность снижается. Причем вершина кривой распределения правонарушителей по возрасту сдвинута от средней влево (к более молодому возрасту) и является асимметричной.
Корреляционные прямолинейные связи могут быть одн о факторными , когда исследуется связь между одним признаком-фактором и одним признаком-следствием (парная корреляция). Они могут быть и многофакторными, когда исследуется влияние многих взаимодействующих между собой признаков-факторов на признак-следствие (множественная корреляция).
Но, какой бы из коэффициентов корреляции не использовался, какая бы корреляция не исследовалась, установить связь между признаками, исходя только из статистических показателей, невозможно. Первоначальный анализ показателей - это всегда анализ качественный , в ходе которого изучается и уясняется социально-правовая природа явления. При этом используются те научные методы и подходы, которые характерны для отрасли науки, изучающей данное явление (социологии, права, психологии и т.д.). Затем анализ группировок и средних величин позволяет выдвинуть гипотезы, построить модели, определить тип связи и зависимости. Только после этого определяется количественная характеристика зависимости - собственно, коэффициент корреляции.
Литература
1. Аванесов Г.А. Основы криминологического прогнозирования. Учебное пособие. М.: ВШ МВД СССР, 1970.
2. Аврутин К.Е., Гилинский Я.И. Криминологический анализ преступности в регионе: методология, методика, техника. Л., 1991.
3. Адамов Е. и др. Экономика и статистика фирм: Учебник / Под ред. С.Д. Ильенковой. М.: Финансы и статистика, 2008.
4. Балакина Н.Н. Статистика: Учеб. - метод. комплекс. Хабаровск: ИВЭСЭП, филиал в г. Хабаровске, 2008.
5. Блувштейн Ю.Д., Волков Г.И. Динамические ряды преступности: Учебное пособие. Минск, 1984.
6. Боровиков В.П., Боровиков И.П. STATISTICA - Статистический анализ и обработка данных в среде Windows. М.: Информационно-издательский дом "Филинъ”, 1997.
7. Бородин С.В. Борьба с преступностью: теоретическая модель комплексной программы. М.: Наука, 1990.
8. Вопросы статистики // Ежемесячный научно-информационный журнал Госкомстата РФ.М., 2002-2009 гг.
9. Гусаров В.М. Статистика: Учеб. пособие для вузов. М.: ЮНИТИ-ДАНА, 2009.
10. Добрынина Н.В., Нименья И.Н. Статистика: Учеб. - метод. пособие. СПб.: СПбГИЭУ, 2009.
11. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник для вузов / Под ред.И. И. Елисеевой.4-е изд. М.: Финансы и статистика, 1999.
12. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: Финансы и статистика, 1995.
13. Еремина Т., Матятина В., Плущевская Ю. Проблемы развития секторов российской экономики // Вопросы экономики. 2009. № 7.
14. Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учеб. пособие.2-е изд., перераб. и доп. М.: Финансы и статистика, 2009.
15. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: ИНФРА-М, 1998.
16. Кириллов Л.А. Криминологическое изучение и предупреждение преступности органами внутренних дел М., 1992.
17. Косоплечев Н.П., Методы криминологического исследования. М., 1984.
18. Ли Д.А. Преступность в России: системный анализ. М., 1997.
19. Ли Д.А. Уголовно-статистический учет: структурно-функциональные закономерности. М.: Информационно-издательское агентство "Русский мир”, 1998.
20. Макарова Н.В., Трофимец В.Я. Статистика в Excel: Учеб. пособие. М.: Финансы и статистика, 2009.
21. Нестеров Л.И. Новые веяния в статистике национального богатства // Вопросы статистики. 2008. № 11.
22. Петрова Е.В. и др. Практикум по статистике транспорта: Учеб. пособие. М.: Финансы и статистика, 2008.
23. Преступность в России в девяностых годах и некоторые аспект законности и борьбы с нею. М., 1995.
24. Преступность, статистика, закон // Под ред. проф. А.И. Долговой. М.: Криминологическая ассоциация, 1997.
25. Ростов К.Т. Преступность в регионах России (социально-криминологический анализ). СПб.: СПб академия МВД России, 1998.
26. Руководство для переписчика о порядке проведения Всероссийской переписи населения 2002 года и заполнения переписных документов. М.: ПИК "Офсет", 2003.
27. Савюк Л.К. Правовая статистика: Учебник. М.: Юристъ, 1999.
28. Салин В.Н., Шпаковская Е.П. Социально-экономическая статистика: Учебник для вузов. М.: Гарданика Юрист, 2008.
29. Сиденко А.В., Попов Г.Ю., Матвеева В.М. Статистика: Учебник. М.: Дело и Сервис, 2008.
30. Социальная профилактика правонарушений: советы, рекомендации // Под ред. Д.А. Керимова. М., 1989.
31. Социальная статистика: Учебник для вузов // Под ред. И.И. Елисеевой. 3-е изд. М.: Финансы и статистика, 2009.
Размещено на Allbest.ru
Подобные документы
Рассмотрение основных методов статистического анализа. Исследование Кунгурского муниципального района. Проведение расчетов по показателям ежегодника. Анализ демографии и социально-экономического развития данного района по результатам применения.
курсовая работа , добавлен 24.06.2015
Средняя величина – свободная характеристика закономерностей процесса в тех условиях, в которых он протекает. Формы и методы расчета средних величин. Применение средних величин на практике: расчет дифференциации заработной платы по отраслям экономики.
курсовая работа , добавлен 04.12.2007
Статистические методы анализа разводов. Статистический анализ разводов в Амурской области. Анализ динамики и структуры разводов. Группировка городов и районов Амурской области по количеству разводов за год. Расчет средних величин и показателей вариации.
курсовая работа , добавлен 12.04.2014
Аспекты статистического анализа обеспеченности жильем. Применение статистических методов для анализа обеспеченности жильем населения. Анализ однородности совокупности районов по коэффициенту демографической нагрузки. Корреляционно-регрессионный анализ.
курсовая работа , добавлен 18.01.2009
Организация государственной статистики в России. Требования, предъявляемые к собираемым данным. Формы, виды и способы статистического наблюдения. Подготовка статистического наблюдения. Ошибки статистического наблюдения. Методы контроля за статистикой.
реферат , добавлен 02.12.2007
Разработка программы наблюдения уголовно-правовой статистики, ее основные этапы и предъявляемые требования, методы и порядок реализации. Определение состояния преступности в исследуемом районе. Правила оформления результатов статистического наблюдения.
контрольная работа , добавлен 18.05.2010
Классификация статистической документации. Виды документов: письменные, иконографические, статистические и фонетические. Методы и способы анализа материалов: неформализованные (традиционные) и формализованные. Порядок осуществления контент-анализа.
презентация , добавлен 16.02.2014
Понятие средней величины. Метод средних величин в изучении общественных явлений. Актуальность применения метода средних величин в изучении общественных явлений обеспечивается возможностью перехода от единичного к общему, от случайного к закономерному.
курсовая работа , добавлен 13.01.2009
Понятие статистического наблюдения. Анализ прямолинейных и криволинейных корреляционных связей. Знакомство с формулами и величинами статистического наблюдения. Анализ расчетов взаимосвязи индексов, построение гистограммы, элементы ряда распределения.
контрольная работа , добавлен 27.03.2012
Характеристика основных показателей статистического анализа социальной обусловленности общественного здоровья в Российской Федерации. Уровни оценки здоровья с точки зрения социальной медицины. Классификация детской части населения по группам здоровья.
Не потеряйте. Подпишитесь и получите ссылку на статью себе на почту.
Деятельность людей во множестве случаев предполагает работу с данными, а она в свою очередь может подразумевать не только оперирование ими, но и их изучение, обработку и анализ. Например, когда нужно уплотнить информацию, найти какие-то взаимосвязи или определить структуры. И как раз для аналитики в этом случае очень удобно пользоваться не только , но и применять статистические методы.
Особенностью методов статистического анализа является их комплексность, обусловленная многообразием форм статистических закономерностей, а также сложностью процесса статистических исследований. Однако мы хотим поговорить именно о таких методах, которые может применять каждый, причем делать это эффективно и с удовольствием.
Статистическое исследование может проводиться посредством следующих методик:
- Статистическое наблюдение;
- Сводка и группировка материалов статистического наблюдения;
- Абсолютные и относительные статистические величины;
- Вариационные ряды;
- Выборка;
- Корреляционный и регрессионный анализ;
- Ряды динамики.
Статистическое наблюдение
Статистическое наблюдение является планомерным, организованным и в большинстве случаев систематическим сбором информации, направленным, главным образом, на явления социальной жизни. Реализуется данный метод через регистрацию предварительно определенных наиболее ярких признаков, цель которой состоит в последующем получении характеристик изучаемых явлений.
Статистическое наблюдение должно выполняться с учетом некоторых важных требований:
- Оно должно полностью охватывать изучаемые явления;
- Получаемые данные должны быть точными и достоверными;
- Получаемые данные должны быть однообразными и легкосопоставимыми.
Также статистическое наблюдение может иметь две формы:
- Отчетность – это такая форма статистического наблюдения, где информация поступает в конкретные статистические подразделения организаций, учреждений или предприятий. В этом случае данные вносятся в специальные отчеты.
- Специально организованное наблюдение – наблюдение, которое организуется с определенной целью, чтобы получить сведения, которых не имеется в отчетах, или же для уточнения и установления достоверности информации отчетов. К этой форме относятся опросы (например, опросы мнений людей), перепись населения и т.п.
Кроме того, статистическое наблюдение может быть категоризировано на основе двух признаков: либо на основе характера регистрации данных, либо на основе охвата единиц наблюдения. К первой категории относятся опросы, документирование и прямое наблюдение, а ко второй – наблюдение сплошное и несплошное, т.е. выборочное.
Для получения данных при помощи статистического наблюдения можно применять такие способы как анкетирование, корреспондентская деятельность, самоисчисление (когда наблюдаемые, например, сами заполняют соответствующие документы), экспедиции и составление отчетов.
Сводка и группировка материалов статистического наблюдения
Говоря о втором методе, в первую очередь следует сказать о сводке. Сводка представляет собой процесс обработки определенных единичных фактов, которые образуют общую совокупность данных, собранных при наблюдении. Если сводка проводится грамотно, огромное количество единичных данных об отдельных объектах наблюдения может превратиться в целый комплекс статистических таблиц и результатов. Также такое исследование способствует определению общих черт и закономерностей исследуемых явлений.
С учетом показателей точности и глубины изучения можно выделить простую и сложную сводку, но любая из них должна основываться на конкретных этапах:
- Выбирается группировочный признак;
- Определяется порядок формирования групп;
- Разрабатывается система показателей, позволяющих охарактеризовать группу и объект или явление в целом;
- Разрабатываются макеты таблиц, где будут представлены результаты сводки.
Важно заметить, что есть и разные формы сводки:
- Централизованная сводка, требующая передачи полученного первичного материала в вышестоящий центр для последующей обработки;
- Децентрализованная сводка, где изучение данных происходит на нескольких ступенях по восходящей.
Выполняться же сводка может при помощи специализированного оборудования, например, с использованием компьютерного ПО или вручную.
Что же касается группировки, то этот процесс отличается разделением исследуемых данных на группы по признакам. Особенности поставленных статистическим анализом задач влияют на то, какой именно будет группировка: типологической, структурной или аналитической. Именно поэтому для сводки и группировки либо прибегают к услугам узкопрофильных специалистов, либо применяют .
Абсолютные и относительные статистические величины
Абсолютные величина считаются самой первой формой представления статистических данных. С ее помощью удается придать явлениям размерные характеристики, например, по времени, по протяженности, по объему, по площади, по массе и т.д.
Если требуется узнать об индивидуальных абсолютных статистических величинах, можно прибегнуть к замерам, оценке, подсчету или взвешиванию. А если нужно получить итоговые объемные показатели, следует использовать сводку и группировку. Нужно иметь в виду, что абсолютные статистические величины отличаются наличием единиц измерения. К таким единицам относят стоимостные, трудовые и натуральные.
А относительные величины выражают количественные соотношения, касающиеся явлений социальной жизни. Чтобы их получить, одни величины всегда делятся на другие. Показатель, с которым сравнивают (это знаменатель), называют основанием сравнения, а показатель, которой сравнивают (это числитель), называют отчетной величиной.
Относительные величины могут быть разными, что зависит от их содержательной части. Например, существуют величины сравнения, величины уровня развития, величины интенсивности конкретного процесса, величины координации, структуры, динамики и т.д. и т.п.
Чтобы изучить какую-то совокупность по дифференцирующимся признакам, в статистическом анализе применяются средние величины – обобщающие качественные характеристики совокупности однородных явлений по какому-либо дифференцирующемуся признаку.
Крайне важным свойством средних величин является то, что они говорят о значениях конкретных признаков во всем их комплексе единым числом. Невзирая на то, что у отдельных единиц может наблюдаться количественная разница, средние величины выражают общие значения, свойственные всем единицам исследуемого комплекса. Получается, что при помощи характеристики чего-то одного можно получить характеристику целого.
Следует иметь в виду, что одним из самых важных условий применения средних величин, если проводится статистический анализ социальных явлений, считается однородность их комплекса, для которого и нужно узнать среднюю величину. А от такого, как именно будут представлены начальные данные для исчисления средней величины, будет зависеть и формула ее определения.
Вариационные ряды
В некоторых случаях данных о средних показателях тех или иных изучаемых величин может быть недостаточно, чтобы провести обработку, оценку и глубокий анализ какого-то явления или процесса. Тогда во внимание следует брать вариацию или разброс показателей отдельных единиц, который тоже представляет собой важную характеристику исследуемой совокупности.
На индивидуальные значения величин могут воздействовать многие факторы, а сами изучаемые явления или процессы могут быть очень многообразны, т.е. обладать вариацией (это многообразие и есть вариационные ряды), причины которой следует искать в сущности того, что изучается.
Вышеназванные абсолютные величины находятся в непосредственной зависимости от единиц измерения признаков, а значит, делают процесс изучения, оценки и сравнения двух и более вариационных рядов более сложным. А относительные показатели нужно вычислять в качестве соотношения абсолютных и средних показателей.
Выборка
Смысл выборочного метода (или проще – выборки) состоит в том, что по свойствам одной части определяются численные характеристики целого (это называется генеральной совокупностью). Основной выборочного метода является внутренняя связь, объединяющая части и целое, единичное и общее.
Метод выборки отличается рядом существенных преимуществ перед остальными, т.к. благодаря уменьшению количества наблюдений позволяет сократить объемы работы, затрачиваемые средства и усилия, а также успешно получать данные о таких процессах и явлениях, где либо нецелесообразно, либо просто невозможно исследовать их полностью.
Соответствие характеристик выборки характеристикам изучаемого явления или процесса будет зависеть от комплекса условий, и в первую очередь от того, как вообще будет реализовываться выборочный метод на практике. Это может быть как планомерный отбор, идущий по подготовленной схеме, так и непланомерный, когда выборка производится из генеральной совокупности.
Но во всех случаях выборочный метод должен быть типичным и соответствовать критериям объективности. Данные требования нужно выполнять всегда, т.к. именно от них будет зависеть соответствие характеристик метода и характеристик того, что подвергается статистическому анализу.
Таким образом, перед обработкой выборочного материала необходимо провести его тщательную проверку, избавившись тем самым от всего ненужного и второстепенного. Одновременно с этим, составляя выборку, в обязательном порядке нужно обходить стороной любую самодеятельность. Это означает, что ни в коем случае не следует делать выборку только из вариантов, кажущихся типичными, а все другие – отбрасывать.
Эффективная и качественная выборка должна составляться объективно, т.е. производить ее нужно так, чтобы были исключены любые субъективные влияния и предвзятые побуждения. И чтобы это условие было соблюдено должным образом, требуется прибегнуть к принципу рандомизации или, проще говоря, к принципу случайного отбора вариантов из всей их генеральной совокупности.
Представленный принцип служит основой теории выборочного метода, и следовать ему нужно всегда, когда требуется создать эффективную выборочную совокупность, причем случаи планомерного отбора исключением здесь не являются.
Корреляционный и регрессионный анализ
Корреляционный анализ и регрессионный анализ – это два высокоэффективных метода, позволяющие проводить анализ больших объемов данных для изучения возможной взаимосвязи двух или большего количества показателей.
В случае с корреляционным анализом задачами являются:
- Измерить тесноту имеющейся связи дифференцирующихся признаков;
- Определить неизвестные причинные связи;
- Оценить факторы, в наибольшей степени воздействующие на окончательный признак.
А в случае с регрессионным анализом задачи следующие:
- Определить форму связи;
- Установить степень воздействия независимых показателей на зависимый;
- Определить расчетные значения зависимого показателя.
Чтобы решить все вышеназванные задачи, практически всегда нужно применять и корреляционный и регрессионный анализ в комплексе.
Ряды динамики
Посредством этого метода статистического анализа очень удобно определять интенсивность или скорость, с которой развиваются явления, находить тенденцию их развития, выделять колебания, сравнивать динамику развития, находить взаимосвязь развивающихся во времени явлений.
Ряд динамики – это такой ряд, в котором во времени последовательно расположены статистические показатели, изменения которых характеризуют процесс развития исследуемого объекта или явления.
Ряд динамики включает в себя два компонента:
- Период или момент времени, связанный с имеющимися данными;
- Уровень или статистический показатель.
В совокупности эти компоненты представляют собой два члена ряда динамики, где первый член (временной период) обозначается буквой «t», а второй (уровень) – буквой «y».
Исходя из длительности временных промежутков, с которыми взаимосвязаны уровни, ряды динамики могут быть моментными и интервальными. Интервальные ряды позволяют складывать уровни для получения общей величины периодов, следующих один за другим, а в моментных такой возможности нет, но этого там и не требуется.
Ряды динамики также существуют с равными и разными интервалами. Суть же интервалов в моментных и интервальных рядах всегда разная. В первом случае интервалом является временной промежуток между датами, к которым привязаны данные для анализа (удобно использовать такой ряд, например, для определения количества действий за месяц, год и т.д.). А во втором случае – временной промежуток, к которому привязана совокупность обобщенных данных (такой ряд можно использовать для определения качества тех же самых действий за месяц, год и т.п.). Интервалы могут быть равными и разными, независимо от типа ряда.
Естественно, чтобы научиться грамотно применять каждый из методов статистического анализа, недостаточно просто знать о них, ведь, по сути, статистика – это целая наука, требующая еще и определенных навыков и умений. Но чтобы она давалась проще, можно и нужно тренировать свое мышление и .
В остальном же исследование, оценка, обработка и анализ информации – очень интересные процессы. И даже в тех случаях, когда это не приводит к какому-то конкретному результату, за время исследования можно узнать множество интересных вещей. Статистический анализ нашел свое применение в огромном количестве сфер деятельности человека, а вы можете использовать его в учебе, работе, бизнесе и других областях, включая развитие детей и самообразование.
Статистические методы
Статисти́ческие ме́тоды - методы анализа статистических данных. Выделяют методы прикладной статистики , которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.
Классификация статистических методов
Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.
Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):
а) разработка и исследование методов общего назначения, без учета специфики области применения;
б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;
в) применение статистических методов и моделей для статистического анализа конкретных данных.
Прикладная статистика
Описание вида данных и механизма их порождения - начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчетов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.
Мы не считаем возможным противопоставлять детерминированные и вероятностно-статистические методы. Мы рассматриваем их как последовательные этапы статистического анализа. На первом этапе необходимо проанализировать имеющие данные, представить их в удобном для восприятия виде с помощью таблиц и диаграмм. Затем статистические данные целесообразно проанализировать на основе тех или иных вероятностно-статистических моделей. Отметим, что возможность более глубокого проникновения в суть реального явления или процесса обеспечивается разработкой адекватной математической модели.
В простейшей ситуации статистические данные - это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке.
При измерении по нескольким количественным или качественным признакам в качестве статистических данных об объекте получаем вектор. Его можно рассматривать как новый вид данных. В таком случае выборка состоит из набора векторов. Есть часть координат - числа, а часть - качественные (категоризованные) данные, то говорим о векторе разнотипных данных.
Одним элементом выборки, то есть одним измерением, может быть и функция в целом. Например, описывающая динамику показателя, то есть его изменение во времени, - электрокардиограмма больного или амплитуда биений вала двигателя. Или временной ряд, описывающий динамику показателей определенной фирмы. Тогда выборка состоит из набора функций.
Элементами выборки могут быть и иные математические объекты. Например, бинарные отношения. Так, при опросах экспертов часто используют упорядочения (ранжировки) объектов экспертизы - образцов продукции, инвестиционных проектов, вариантов управленческих решений. В зависимости от регламента экспертного исследования элементами выборки могут быть различные виды бинарных отношений (упорядочения, разбиения, толерантности), множества, нечеткие множества и т. д.
Итак, математическая природа элементов выборки в различных задачах прикладной статистики может быть самой разной. Однако можно выделить два класса статистических данных - числовые и нечисловые. Соответственно прикладная статистика разбивается на две части - числовую статистику и нечисловую статистику.
Числовые статистические данные - это числа, вектора, функции. Их можно складывать, умножать на коэффициенты. Поэтому в числовой статистике большое значение имеют разнообразные суммы. Математический аппарат анализа сумм случайных элементов выборки - это (классические) законы больших чисел и центральные предельные теоремы.
Нечисловые статистические данные - это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечеткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах. С помощью расстояний определяются эмпирические и теоретические средние, доказываются законы больших чисел, строятся непараметрические оценки плотности распределения вероятностей, решаются задачи диагностики и кластерного анализа, и т. д. (см. ).
В прикладных исследованиях используют статистические данные различных видов. Это связано, в частности, со способами их получения. Например, если испытания некоторых технических устройств продолжаются до определенного момента времени, то получаем т. н. цензурированные данные, состоящие из набора чисел - продолжительности работы ряда устройств до отказа, и информации о том, что остальные устройства продолжали работать в момент окончания испытания. Цензурированные данные часто используются при оценке и контроле надежности технических устройств.
Обычно отдельно рассматривают статистические методы анализа данных первых трех типов. Это ограничение вызвано тем отмеченным выше обстоятельством, что математический аппарат для анализа данных нечисловой природы - существенно иной, чем для данных в виде чисел, векторов и функций.
Вероятностно-статистическое моделирование
При применении статистических методов в конкретных областях знаний и отраслях народного хозяйства получаем научно-практические дисциплины типа «статистические методы в промышленности», «статистические методы в медицине» и др. С этой точки зрения эконометрика - это «статистические методы в экономике». Эти дисциплины группы б) обычно опираются на вероятностно-статистические модели, построенные в соответствии с особенностями области применения. Весьма поучительно сопоставить вероятностно-статистические модели, применяемые в различных областях, обнаружить их близость и вместе с тем констатировать некоторые различия. Так, видна близость постановок задач и применяемых для их решения статистических методов в таких областях, как научные медицинские исследования, конкретные социологические исследования и маркетинговые исследования, или, короче, в медицине , социологии и маркетинге . Они часто объединяются вместе под названием «выборочные исследования».
Отличие выборочных исследований от экспертных проявляется, прежде всего, в числе обследованных объектов или субъектов - в выборочных исследованиях речь обычно идет о сотнях, а в экспертных - о десятках. Зато технологии экспертных исследований гораздо изощреннее. Еще более выражена специфика в демографических или логистических моделях, при обработке нарративной (текстовой, летописной) информации или при изучении взаимовлияния факторов.
Вопросы надежности и безопасности технических устройств и технологий, теории массового обслуживания подробно рассмотрены, в большом количестве научных работ.
Статистический анализ конкретных данных
Применение статистических методов и моделей для статистического анализа конкретных данных тесно привязано к проблемам соответствующей области. Результаты третьего из выделенных видов научной и прикладной деятельности находятся на стыке дисциплин. Их можно рассматривать как примеры практического применения статистических методов. Но не меньше оснований относить их к соответствующей области деятельности человека.
Например, результаты опроса потребителей растворимого кофе естественно отнести к маркетингу (что и делают, читая лекции по маркетинговым исследованиям). Исследование динамики роста цен с помощью индексов инфляции, рассчитанных по независимо собранной информации, представляет интерес прежде всего с точки зрения экономики и управления народным хозяйством (как на макроуровне, так и на уровне отдельных организаций).
Перспективы развития
Теория статистических методов нацелена на решение реальных задач. Поэтому в ней постоянно возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими средствами, то есть путем доказательства теорем. Большую роль играет методологическая составляющая - как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.
Актуальной является задача анализа истории статистических методов с целью выявления тенденций развития и применения их для прогнозирования.
Литература
2. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем. - М.: Мир, 1975. - 500 с.
3. Крамер Г. Математические методы статистики. - М.: Мир, 1948 (1-е изд.), 1975 (2-е изд.). - 648 с.
4. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. - М.: Наука, 1965 (1-е изд.), 1968 (2-е изд.), 1983 (3-е изд.).
5. Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. Изд. 3-е, стереотипное. - М.: Наука, 1969. - 512 с.
6. Норман Дрейпер, Гарри Смит Прикладной регрессионный анализ. Множественная регрессия = Applied Regression Analysis. - 3-е изд. - М.: «Диалектика» , 2007. - С. 912. - ISBN 0-471-17082-8
Смотри также
Wikimedia Foundation . 2010 .
- Yat-Kha
- Амальгама (значения)
Смотреть что такое "Статистические методы" в других словарях:
СТАТИСТИЧЕСКИЕ МЕТОДЫ - СТАТИСТИЧЕСКИЕ МЕТОДЫ научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово “статистика” (от игал. stato государство) имеет общий корень со словом “государство”. Первоначально оно… … Философская энциклопедия
СТАТИСТИЧЕСКИЕ МЕТОДЫ – - научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово «статистика» (от итал. stato – государство) имеет общий корень со словом «государство». Первоначально оно относилось к науке управления и … Философская энциклопедия
Статистические методы - (в экологии и биоценологии) методы вариационной статистики, позволяющие исследовать целое (напр., фитоценоз, популяцию, продуктивность) по его частным совокупностям (напр., по данным, полученным на учетных площадках) и оценить степень точности… … Экологический словарь
статистические методы - (в психологии) (от лат. status состояние) нек рые методы прикладной математической статистики, используемые в психологии в основном для обработки экспериментальных результатов. Основная цель применения С. м. повышение обоснованности выводов в… … Большая психологическая энциклопедия
Статистические методы - 20.2. Статистические методы Конкретные статистические методы, используемые для организации, регулирования и проверки деятельности, включают, но не ограничиваются следующими: а) планированием экспериментов и факторный анализ; b) анализ дисперсии и … Словарь-справочник терминов нормативно-технической документации
СТАТИСТИЧЕСКИЕ МЕТОДЫ - методы исследования количеств. стороны массовых обществ. явлений и процессов. С. м. дают возможность в цифровом выражении характеризовать происходящие изменения в обществ. процессах, изучать разл. формы социально экономич. закономерностей, смену… … Сельско-хозяйственный энциклопедический словарь
СТАТИСТИЧЕСКИЕ МЕТОДЫ - некоторые методы прикладной математической статистики, используемые для обработки экспериментальных результатов. Ряд статистических методов был разработан специально для проверки качества психологических тестов, для применения в профессиональном… … Профессиональное образование. Словарь
СТАТИСТИЧЕСКИЕ МЕТОДЫ - (в инженерной психологии) (от лат. status состояние) некоторые методы прикладной статистики, используемые в инженерной психологии для обработки экспериментальных результатов. Основная цель применения С. м. повышение обоснованности выводов в… … Энциклопедический словарь по психологии и педагогике