Анализ данных
Методы анализа данных классифицируются по следующим критериям:
- по количеству одновременно анализируемых переменных – простые и многофакторные методы;
- по цели анализа – описательные и индуктивные методы;
- по уровню шкалирования переменных;
- в зависимости от того, делятся ли переменные на зависимые и независимые (методы анализа зависимостей и методы анализа взаимосвязей).
Описательные однофакторные методы:
- распределение частот (представление в таблице или на графике);
- графическое представление распределения переменной (гистограммы и т.д.);
- статистические показатели – арифметическое среднее, медиана, мода, вариация, дисперсия.
Индуктивные однофакторные методы предназначены для проверки соответствия характеристик выборки характеристикам генеральной совокупности (ГС). Они делятся на параметрические тесты, предназначенью для проверки гипотез о неизвестных характеристиках ГС, и непараметрические, предназначенные для проверки гипотез о распределении ГС.
Тесты: параметрический г-тест применим в случае, если переменная распределена нормально, дисперсия известна и объем выборки больше 30. Т-тест применяется при выборках, меньших 30. Х-квадрат-тест применяется для проверки гипотез о распределении.
Двух- и многофакторные методы анализа зависимостей – на которые можно ответить с помощью вопросов: «Какая связь имеется между расходами на рекламу и ценой?» или» Имеется ли связь между возрастом человека и выбором определенной марки?»
Регрессионный анализ – определение зависимости одной переменной от одной (простая регрессия) или нескольких (многофакторная регрессия) независимых переменных.
Вариационный анализ – предназначен для проверки того, существенно ли влияет изменение независимых переменных на зависимые.
Дискриминантный анализ – позволяет разделить заранее заданные группы объектов через комбинацию многих независимых переменных и таким образом объяснить различия между группами.
Факторный анализ – предназначен для исследования взаимосвязей между переменными с целью уменьшения числа влияющих факторов до наиболее существенных.
Кластер-анализ-метод – с помощью которого можно разделить совокупность объектов на отдельные более или менее однородные группы.
Многомерное шкалирование позволяет получить пространственное отображение отношений, существующих между объектами.
Возможность применения того или иного вида анализа зависит от уровня шкалирования независимых и зависимых переменных.
Выбор определенного метода зависит от характера и направления связей между переменными, уровня шкалирования, от решаемой проблемы.