11.4. ОБРАБОТКА ПЕРВИЧНОЙ СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ, АНАЛИЗ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ. КВАНТИФИКАЦИЯ И ШКАЛИРОВАНИЕ
Обработка первичной социологической информации может проводиться вручную, с помощью средств малой механизации, с использованием компьютерной техники. Основные этапы обработки первичной информации следующие.
Первый этап.
Разрабатываются логическая схема обработки и анализа получаемых данных. В ходе этого этапа устанавливаются формы документов для сбора информации, методы ее кодирования для ручной и машинной обработки, методы контроля данных и устранения ошибок. Определяются порядок и методы обработки данных, алгоритм расчетов, разрабатываются система анализа полученных в ходе обработки данных, основные направления анализа.Второй этап. В случае обработки данных компьютерными методами осуществляется разработка математического обеспечения, выясняется, какие необходимы программы для обработки материалов исследования, иногда разрабатывается новое программное обеспечение.
Третий этап. Подготовка данных первичной социологической информации к обработке. Работа эта очень трудоемка. Так, при обработке данных анкетирования открытые вопросы анкет “закрывают” — классифицируют по определенным признакам, систематизируют и кодируют в соответствии с классификацией. Осуществляют проверку анкет на качество заполнения. Эта проверка включает три момента:
• на полноту заполнения (ответ может отсутствовать из-за нежелания респондента отвечать, непонимания им вопроса, небрежности в заполнении анкеты). При невозможности устранить ошибку отдельные вопросы или вся анкета изымается из обработки. Часто устанавливают “критерий полноты заполнения”, например, процент незаполненных вопросов анкеты, при превышении которого она будет изъята из обработки. В случае большого изъятия, ставящего под сомнение репрезентативность выборки, возможно возникновение необходимости дополнительного сбора исходных данных;
• на надежность (определяется отклонение от репрезентативной выборки, с помощью контрольных и фильтрующих вопросов проверяется качество информации, устраняются противоречивые ответы, умышленно недостоверные, отфильтровываются ответы или анкеты лиц, некомпетентных в исследуемых вопросах и т.д.);
• на технологичность (удобство обработки).
Все ответы необходимо привести к виду, дающему возможность легко перенести информацию на машинный носитель для обработки. Из анкет убирают все пометки, которые можно неоднозначно трактовать, номера (шифры) выбранных ответов четко обводятся ручкой.Далее подсчитывают все документы, входящие в обрабатываемый массив информации, каждому присваивается порядковый номер. Информация кодируется, т.е. категориям документа присваиваются условные обозначения (шифр, код). Если все вопросы анкеты закрытые, кодирование может осуществляться в ходе ее разработки. При наличии полузакрытых и открытых вопросов кодировать информацию возможно только после их “закрытия”. Закодированную информацию переносят на машинные носители, контролируют качество переноса и устраняют ошибки.
Четвертый этап. Обработка информации (расчет средних величин, установление корреляционных связей, составление группировок, таблиц, графиков и пр.)
Рассмотрим некоторые из перечисленных методов.
1. Простые вариацюнные рады. Пусть варьируемый признак (варианта) Xi — стаж. Объем анализируемой совокупности — 8 чел. Тогда частота проявления признака — пi, т.е. количество человек из данной совокупности с данным стажем. Вариационный ряд будет выглядеть так: Хi(стаж, лет)
5
6
7
8
9
10
ni (чел.)
1
0
1
2
0
4
Помимо частоты распределения варьируемого признака, можно определить его частость (mi), т.е. долю частоты в общем объеме совокупности. Так, частость 6-й варианты (стаж 10 лет) составит:
или 50%.
2. Интервальные вариационные ряды. Пример интервального вариационного ряда: Xi (стаж, лет)
до 1 года
Свыше 1
до 5 лет
Свыше 5 до 8 лет
Свыше 8
до 12 лет
и т. д.
mi (%)
20,7
10,5
8,4
15,2
и т.д.
Здесь важно выбрать оптимальную величину интервала (более 20 группировочных интервалов делать не рекомендуется).
Величина интервала определяется по формуле:,
где Xmax и Xmin — соответственно максимальное и минимальное значения варианты в исследуемой совокупности;
n — величина анализируемой совокупности;
lg—десятичный логарифм;
? — величина интервала.
Пример. Численность работников составляет 1000 чел., максимальный стаж работы на данном предприятии — 40 лет, минимальный — 1 год,
лет.
Тогда интервалы могут быть установлены следующим образом:
до 1 года;
1+3,69 = 4,69 ? 5 лет;
4,69 + 3,69 = 8,38 ? 8 лет;
8,38 + 3,69 = 12,07 ? 12 лет и т.д.
Могут применяться как равные, так и неравные интервалы.
3. Расчет средних величин. Средняя величина представляет собой абстрактную характеристику всей анализируемой совокупности.
а) Среднеарифметическая величина рассчитывается по формуле:
,
где — сумма значений варьируемого признака;
— сумма всех членов совокупности.
Пример. Если взять за основу данные приведенного выше простого вариационного ряда, то среднеарифметический стаж составит:
года.
б) Среднеарифметическая взвешенная величина учитывает частоту лроявления признака, последняя выступает в качестве весов. Расчет яедется по формуле:
.
Пример. В нашем случае среднеарифметическая взвешенная стажа составит
лет.
в) Для расчета средних величин по коэффициентам используется среднегеометрическая величина, рассчитываемая как корень n-й степени из произведения п коэффициентов.
Пример. Имеется 4 коэффициента, характеризующих текучесть кадров в четырех подразделениях предприятия: К1 = 0,85; К2 = 0,9; К3 = 0,4; K4 = 0,6. Тогда средний коэффициент по четырем подразделениям, рассчитанный как среднегеометрическая величина, составит:
г) Определение медианы — значения признака у той единицы совокупности, которая расположена в середине упорядоченного ряда.
Если число членов ряда четное, то медиана определяется как среднеарифметическое из двух серединных значений.
Пример. Имеется упорядоченный ряд:
№работника
1
2
3
4
5
6
7
8
стаж
20
16
10
8
7
5
1
1
Медиана равна: лет.
Если число членов ряда нечетное, то за медиану принимается значение признака у среднего члена ряда.
Пример. Если в рассмотренном простом вариационном ряду не было бы 8-го работника, медиана была бы равна значению величины стажа у 4-го работника, т.е. 8 лет.
д) Определение моды — наиболее часто встречающегося значения признака (варианты с наибольшей частотой).
Пример. На основе приведенного выше простого вариационного ряда можно определить моду как 10 лет (численность работников с данным значением стажа в анализируемой группе наибольшая).
4. Расчет показателей вариации (колеблемости) признака, оценивающих “разброс” его значений в анализируемой совокупности.
а) Среднее линейное отклонение рассчитывается как средняя арифметическая величина из абсолютных величин отклонения значений признака от его среднеарифметического значения:
,
где Xi — величина i-го значения признака;
X — среднеарифметическое значение признака;
n — общее количество значений признака (единиц совокупности).
б) Дисперсия признака — величина, равная среднему значению квадрата отклонений отдельных значений признака от его средней арифметической величины:
.
в) Коэффициенты вариации (степень рассеяния) признака рассчитываются как отношение среднего линейного или среднего квадра-тического (дисперсия) отклонения к средней арифметической величине его значения.
5. При анализе данных социологического исследования используются статистические таблицы на основе группировок.
Здесь главное — правильный выбор группировочных признаков. Эти таблицы могут быть:а) простые — перечень всех единиц совокупности с количественной или качественной характеристикой каждой;
б) групповые — единицы совокупности группируются по одному признаку;
в) комбинационные — единицы совокупности группируются по 2-м г и более признакам.
6. В ходе анализа могут быть использованы графики, наглядно отражающие распределение исследуемых признаков. Это по существу графическое изображение интервального ряда.
а) Гистограмма на основе данных простого вариационного ряда
б) Гистограмма на основе интервального вариационного ряда (общее число единиц совокупности — работников со стажем, входящих в тот или иной интервал, — характеризуется площадью прямоугольников).
в) полигон распределения
7. Изучение статистических зависимостей. Здесь применяются корреляционный анализ (установление формы, направления, плотности взаимосвязи нескольких признаков); регрессионный анализ (анализ изменения значений результирующего признака в зависимости от влияния на него признаков-факторов); факторный анализ (оценивает вариации признаков и внутренние взаимосвязи).
Помимо перечисленных методов статистического анализа, используются и иные методы. Функциональный анализ нацелен на выявление устойчивых взаимосвязей. Структурный анализ определяет внутренние элементы объекта исследования и их сочетания.
Генетический выявляет фазы развития объекта исследования, устанавливает причинные связи. В ходе системного анализа осуществляется целостное изучение объекта, а также описание его в системе влияющих на его состояние факторов. Логлинейный анализ — это поиск и оценка взаимосвязей в аналитической или группировочной таблице, сжатое описание табличных данных. Задача латентного анализа — определение не поддающихся наблюдению, скрытых от внешнего взгляда признаков.
В ходе сбора и обработки данных социологического исследования нередко встает вопрос об измерении социологических характеристик, не имеющих числового выражения (мнения, оценки, суждения и т.п.).
Чтобы решить эту проблему, применяется процедура квантификации, т.е. придания качественным признакам количественной определенности.Для того чтобы измерить социальное свойство, необходимо найти “индикатор” измерения — внешний признак его проявления. В качестве индикаторов могут выступать и варианты ответов на вопросы, а инструментом измерения является шкала. В ходе разработки шкалы сначала определяется ее континуум (продолжительность) от наиболее сильного варианта признака (проявления социального свойства) к наиболее слабому. Затем шкала градуируется, т.е. дробится на определенные части: “полностью удовлетворен” — “удовлетворен” — “скорее удовлетворен, чем не удовлетворен” — “скорее не удовлетворен, чем удовлетворен” — “не удовлетворен” — “совершенно не удовлетворен”.
Применяются следующие типы шкал.
Номинальная (неупорядоченная) шкала наименований представляет собой перечень характеристик объекта или явления. Она позволяет осуществить группировку характеристик по различным признакам. С ее помощью можно найти частоты распределения признаков, определить моду или модальную величину (выявить группу наибольшей численности по какому-то признаку), рассчитать коэффициенты сопряженности по двум признакам (пол — причина увольнения).
Ранговая шкала (шкала порядка) упорядочивает проявление свойств от большего к меньшему или, наоборот, от меньшего к большему. Так, если мы выстроим мотивы увольнений работников по собственному желанию в порядке от мотивов большей значимости к мотивам меньшей значимости, то также получим ранговую шкалу. Ранговая шкала позволяет определить ранговую корреляцию — связь в двух рядах признаков, дисперсию признака, средневзвешенные величины, индексы.
Интервальная (метрическая) шкала образуется на основе ранговой путем присвоения баллов ее делениям.
По форме шкалы могут быть:
вербальные (словесные утверждения);
числовые (баллы);
графические:
На графической шкале респондент должен указать место, соответствующее степени проявления признака (в нашем случае — степень согласия);
смешанные.
При конструировании шкалы используются различные методы.
1. Метод прямого измерения — оценка свойства проводится респондентом путем выбора ответа из серии предлагаемых, которым приписывается числовое значение. Иногда для этих целей используется графическая шкала, где крайние значения обозначены, допустим, 5 и 1, середина — 3; или крайние значения — от +1 до —1, середина— 0.
2. Метод ранжирования. Упорядочив объекты по степени выраженности анализируемого признака, приписываем им числовую оценку по месту в данном ранжированном ряду.
3. Метод попарных сравнений. Объекты сравнения ранжируются в зависимости от количества выборов, полученных в ходе всех сравнений.
4. Метод равных интервалов. Опрашиваемым, чаще экспертам, выдается заранее составленный список суждений с тем, чтобы расположить их в фиксированное число (обычно 7—11) категорий по значимости. При этом эксперты должны считать, что интервалы, т.е. отличия одного суждения от другого, равны. Порядковый номер категории присваивается суждению в качестве ранга.
Существуют и другие, более сложные методы конструирования шкал.
Основное требование к шкале — ее надежность. Понятие надежности шкалы включает три ее характеристики:
• обоснованность (валидность) — шкала способна измерять именно заданное социальное свойство;
• полнота — в шкале учтены все варианты индикатора (признака проявления свойства);
• чувствительность — способность шкалы дифференцировать степень проявления социального свойства.
В какой-то мере к инструментам квантификации можно отнести социологические индексы, используемые для характеристики совокупности свойств исследуемого объекта. В отличие от статистических индексов, отражающих динамику явления, социологические оценивают качественное его состояние на конкретный момент.
Заключительная часть анализа данных социологического исследования — составление отчета, который отражает содержание программы исследования, ее выполнение, полученные выводы, содержит практические рекомендации и оценивает возможности их внедрения, ожидаемые социальные и экономические результаты использования практических предложений.
Еще по теме 11.4. ОБРАБОТКА ПЕРВИЧНОЙ СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ, АНАЛИЗ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ. КВАНТИФИКАЦИЯ И ШКАЛИРОВАНИЕ:
- 11.3. ОСНОВНЫЕ МЕТОДЫ ПОЛУЧЕНИЯ ПЕРВИЧНОЙ СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ
- Статистическая обработка результатов психолого-педагогического исследования
- 4.7. Интерпретация результатов 4.7.1. Интерпретация как теоретическая обработка эмпирической информации
- 3.4.3. Методы сбора и анализа социологической информации
- 4.6.2. Первичная обработка
- 11.3. Обработка информации
- Последовательная обработка информации
- Трехуровневая технология обработки информации в ИТКС
- 1 этап—определение проблемы: первичный обмен информацией.
- Характеристика технических средств получения и обработки информации в составе комплексного мониторинга
- Каргина Ирина Г еоргиевна. СОВРЕМЕННЫЙ РЕЛИГИОЗНЫЙ ПЛЮРАЛИЗМ: ТЕОРЕТИКО- СОЦИОЛОГИЧЕСКИЙ АНАЛИЗ. ДИССЕРТАЦИЯ на соискание ученой степени доктора социологических наук, 2015
- КСЕНОБИОТИКИ, ПОСТУПАЮЩИЕ В ОРГАНИЗМ В РЕЗУЛЬТАТЕ ПОЛУЧЕНИЯ, ОБРАБОТКИ ИЛИ ХРАНЕНИЯ ПИЩЕВЫХ ПРОДУКТОВ
- 8. Методы обработки материалов исследования