5.8. Этап восьмой. Экспериментальное исследование систем
Легко воспринимается, что эксперимент нужен для совершенствования модели. Важно понять также, что эксперимент невозможен без модели. Они находятся в одном цикле (рис. 5.11). Однако вращение по этому циклу напоминает не вращающееся колесо, а катящийся снежный ком — с каждым оборотом он становится все больше, весомее.
Рис. 5.11 |
Эксперимент и измерения. Разнообразие экспериментов можно упрощенно описать их классификацией. Если мы не вмешиваемся в ход событий, а только регистрируем, что происходит на входах и выходах интересующей нас системы, то опыт называется пассивным экспериментом (или наблюдением). Если же мы не только созерцаем (и фиксируем) происходящее на входах и выходах, но и воздействуем на некоторые из них (одни намеренно поддерживая неизменными, другие — меняя должным образом), то опыт называется активным (или управляемым) экспериментом. Как и любая классификация, эта лишь приближенно описывает реальность. В абсолютно чистом виде эти два эксперимента невозможны: активный — потому, что все входы и выходы контролировать невозможно (некоторые даже неизвестны), пассивный — потому, что всякое измерение и наблюдение — взаимодействие, и вовсе не вмешаться в получаемый результат нельзя. Ближайшими реальными, близкими к идеальным, экспериментами являются активный лабораторный опыт и пассивные наблюдения в астрономии, истории, археологии, психологии и т.п.
Еще одна важная классификация — деление экспериментов на прямые и косвенные. Е[рямой эксперимент — это наблюдение непосредственно той характеристики, которая нас интересует (например, привес молодняка можно измерять ежедневным взвешиванием). Иногда интересующая нас характеристика не поддается прямому измерению, но есть наблюдаемая величина, связанная с нею, из наблюдений которой можно извлечь нужную нам информацию; это и будет косвенное наблюдение (например, по некоторым действиям матери можно судить о силе материнской любви, по ценам — о стоимости, по артериальному давлению — о состоянии сердечно-сосудистой системы). Деление измерений на прямые и косвенные важно потому, что их надо обрабатывать по-разному, даже если они описаны в одинаковой шкале.
Осуществившиеся результаты эксперимента фиксируются в виде протокола наблюдений. Эта запись — не сам эксперимент, а описание его результата, т.е. его модель. Е1онимая термин «язык» широко,
можно сказать, что протокол наблюдений — это запись результатов эксперимента на некотором языке. Разнообразие экспериментов таково, что одним языком не обойтись; существует несколько таких языков, называемых измерительными шкалами. Следует ознакомиться с ними, так как в практике придется иметь дело с обработкой данных в разных шкалах, а делать это нужно по-разному для каждой шкалы. Как в любом языке, неправильно построенная фраза теряет смысл, так и неправильно преобразованные данные эксперимента не несут ожидаемой информации.
Измерительные шкалы. На примере измерительных шкал можно проследить явление, характерное для всех языков (вспомните обсуждение языковых моделей в главе 3): начиная с универсального, но малоинформативного языка, можно, включая, присоединяя к нему дополнительную информацию, получать все более и более информативные языки, вплоть до наиболее математизированного.
1. Шкала наименований (номинальная, классификационная). В разделе об абстрактных моделях главы 3 отмечалось, что простейшей моделью разнообразия является классификация.
Она и положена в основу шкалы наименований. Измерение в этой шкале состоит в том, чтобы, произведя наблюдение классификационных признаков объекта, определить, к какому классу он относится, и записать это с помощью символа, обозначающего данный класс.Фамилии, диагноз заболевания, номера домов, автомобилей, игроков спортивных команд, названия цветов, адреса и т.д. — примеры наблюдений в номинальной шкале.
Пусть введено & классов: Аи А2, ..., Ак (А3 — имя х-го класса). Пусть поочередно наблюдаются объекты хь х2, ..., хы (их совокупность называется выборкой, Ы— объем выборки). Относительно каждого х{ (г =1,Ы ) делается заключение, к какому из классов Аь ..., Ак он относится (х{ е А3). Итог и будет протоколом наблюдений.
Поскольку единственным отношением, определяющим шкалу, является отношение эквивалентности (объект либо принадлежит к данному классу, либо нет), то единственной допустимой операцией над данными в этой шкале является проверка на совпадение. Эта операция изображается с помощью символа Кронекера 4>= {1: х., = Хр 0: х, = = л,}, т.е. совпадение двух разных наблюдений (принадлежность к одному классу) обозначается единицей, несовпадение — нулем. С результатами этой первичной обработки можно выполнить вторичную обра-
N
ботку. Например, число наблюдений одного класса с л:; равно пу = ^, делать нельзя — результат не будет иметь силы. Например, если вы знаете, что на улице сто домов, то неправильно говорить, что географическая середина улицы около 50-го.
2. Шкала порядковая (ординальная, ранговая). Если ввести между классами номинальной шкалы дополнительное отношение порядка (предпочтения; обозначим его символом ™), получится новая, усиленная в информационном смысле шкала, называемая порядковой или ординальной.
Е1римерами наблюдений, регистрируемых в порядковой шкале, являются: армейские и чиновничьи звания, школьные оценки, магнитуда землетрясений (шкала Рихтера), твердость минералов (шкала Мооса), сила ветра (шкала Бофорта), призовые места в соревнованиях.
Допустимое преобразование 4> (сРазУ заметим, что допустимые преобразования для более слабых шкал допустимы и в более сильных, но не наоборот) теперь дополняется операцией проверки предпочтения Су. Су = {1: xt >xß 0: xt < Xj}. Итак, первичная обработка данных в порядковой шкале состоит из двух допустимых преобразований: dy и Су. Е1рименение других операций приведет к недоразумениям. Е1римером служит безуспешная попытка учитывать «средний школьный балл» при поступлении в вузы. В этом неудачном эксперименте баллы рассматривались как числа и складывались. Операция сложения в порядковой шкале недопустима и дает бессмысленный результат. Эксперимент пришлось отменить.
С результатами первичной обработки (двоичными числами) можно производить подходящую вторичную. Например, можно установить номер наблюдения в упорядоченном ряду всех наблюде-
N
ний: . Этот номер называется рангом i-го объекта (отсюда
j=1
происходит еще одно название для данного типа шкалы —ранговая). Возможны и другие использования чисел 4> и Сгу кроме нахождения частот и мод (как и для номинальной шкалы), появляется возможность определить выборочную медиану (т.е. наблюдение с рангом, ближайшим к числу — ), можно разбить всю выборку на части в любой пропорции, находя выборочные квантили любого уровня р, О —р— 1 (т.е. наблюдения с рангом Rb ближайшим к величине Np), можно определить коэффициенты ранговой корреляции между двумя сериями порядковых наблюдений (rs Спирмэна, т Кендалла), строить другие статистические процедуры.
Несколько дополнительных замечаний о порядковых шкалах.
Разновидностями предпочтений являются упорядочивание при наличии стандартных опорных образцов (например, шкала Мооса основана на десяти конкретных минералах разной твердости), при нечетко заданных образцах (шкала силы ветра, школьные оценки), при отсутствии образцов (спортивные соревнования, музыкальные конкурсы).
Кроме шкал совершенного порядка, однозначно определяющих предпочтения (нумерация очередности, воинские звания и т.п.), существуют шкалы квазипорядка, когда некоторые элементы упорядоченного ряда неразличимы (мать = отец > сын = дочь; дядя = = тетя < брат = сестра), а также шкалы частичного порядка, когда имеются несравнимые между собой пары классов (например, в социологических исследованиях субъект иногда не в состоянии оценить, что ему больше нравится — клетчатые носки или фруктовые консервы, велосипед или магнитофон, читать или плавать и т.п.).
В порядковых шкалах не существует понятия расстояния между классами, поэтому любые преобразования, сохраняющие порядок («монотонные») не влияют на информативность данных. (Можно рядовым повесить на погоны звездочку и всем вышестоящим чинам добавить по звездочке — будет красивее, но суть не меняется.)
3. Шкала интервалов (разностей). Если упорядочение объектов можно выполнить настолько точно, что известны расстояния между любыми двумя из них, то измерение станет заметно более информативным, чем в шкале порядка. Естественно выражать все расстояния в единицах, хотя и произвольных, но одинаковых по всей
длине шкалы. Это означает, что объективно равные интервалы измеряются одинаковыми отрезками шкалы, где бы они на ней ни располагались (рис. 5.12).
Рис. 5.12 |
В итоге оказывается, что у нашей новой шкалы — шкалы интервалов — начало отсчета и единица длины интервала произвольны Ли
(—= const).
Ат
Примеры наблюдений, фиксируемых в шкале интервалов:
— температура (шкалы Цельсия, Фаренгейта, Кельвина);
— летоисчисление (от Рождества Христова, от переезда Мухаммеда в Медину — на 622 года позднее, от императорской династии в Китае — на 5000 лет раньше);
— высота местности (от уровня моря; Голландия почти вся имеет отрицательную высоту).
Единственной новой допустимой операцией первичной обработки над данными в новой шкале является вычитание, т.е. определение интервала между двумя отсчетами. Например, если сказать, что температура увеличилась в два раза при нагреве от 9° до 18° по Цельсию, то для привыкших пользоваться шкалой Фаренгейта это будет звучать весьма странно, так как в этой шкале температура изменится от 48,2° до 64,4°. Операция деления для данной шкалы недопустима. Только интервалы имеют смысл настоящих чисел. Над ними (вторичная обработка) уже можно выполнять любые арифметические действия, а также статистические и другие процедуры.
4. Шкала циклическая (периодическая, разностей). Есть специальный вид интервальной шкалы, который характерен тем, что она замкнута на себя, т.е. после прохождения определенного периода ее значения повторяются. Примерами являются: угловые направления из одной точки (шкала компаса, роза ветров), время суток (циферблат часов), фаза периодических колебаний (в градусах или радианах), географическая долгота (в градусах). Все сказанное об интервальной шкале относится и к циклической. Чтобы не возникло
недоразумений, отметим, что сложение часов — не сложение самих временных отметок (что является недопустимой операцией), а сложение временных интервалов, т.е. вторичная обработка. Надо еще помнить об условности начала отсчета (например, при переходе на зимнее время, при пересечении линии смены дат и т.п.). Данную шкалу еще называют шкалой разностей, так как она инвариантна к сдвигу на интервал, называемый периодом шкалы.
5. Шкала отношений. Введение еще одного определяющего отношения придает дополнительное усиление измерениям. Потребуем, чтобы не только отношения величин одного интервала в разных шкалах были константой, где бы этот интервал ни находился
, что характерно для шкалы интервалов, но чтобы и отношения значений одной и той же величины, измеряемой в разных шкалах, тоже были константой, какое бы место эта величина ни занимала
в реальности I(рис. 5.13). Получаемая шкала именуется
шкалой отношений. При этом, хотя единица измерений остается произвольной, нулевая отметка становится абсолютной, несдвигаемой.
Примерами величин, природа которых соответствует шкале отношений, являются:
— длина (измеримая в см, футах, аршинах, км и т.д.);
— вес (кг, фунты, пуды, тонны и т.д.);
— объем (м3, баррели, литры и т.д.);
— деньги (рубли, доллары, евро, йены и т.д.).
Данные в шкале отношений в еще большей степени становятся числами: в первичной обработке с ними имеют смысл любые арифметические операции, то же можно делать и во вторичной.
4. Абсолютная шкала. Предыдущие «числовые» шкалы (интервальная и отношений) имели степени свободы: интервальная — две (произвольный нуль и единицу), отношений — одну (фиксированный, несдвигаемый нуль и произвольную единицу). Характерно, что «числовые»возможности данных в этих шкалах были ограничены: в интервальной шкале — операцией разности, в шкале отношений — арифметическими операциями.
Рассмотрим такую шкалу, которая имеет и абсолютный нуль, и абсолютную единицу. Эта шкала не имеет степеней свободы, она единственна, уникальна. Именно такими качествами обладает числовая ось, которую естественно назвать абсолютной шкалой. Важная отличительная особенность абсолютной шкалы состоит в том, что значения данных в ней не имеют размерности, наименований, ее единица абсолютна («штука»). Это придает данным в этой шкале особый статус (в английском языке их называют риге пишЬегь — чистые числа) — с ними можно производить такие операции, которые недопустимы с поименованными числами. (Можно записать 2 см2, но бессмысленно 32см.) Их можно употреблять в качестве показателя степени, основания логарифма, над ними допустимы любые тригонометрические и другие трансцендентные преобразования.
Числовая ось используется как измерительная шкала при счете предметов, а как вспомогательное средство присутствует во всех остальных шкалах. Внутренние свойства числовой оси, при всей кажущейся ее простоте, разнообразны и сложны — теория чисел не исчерпала их до конца. А некоторые безразмерные числовые отношения, обнаруживаемые и на самой оси, и в природе, вызывают изумление и восхищение: простые числа, числа Фибоначчи, гармонические отношения звуков, размеров; законы теории размерности и подобия; квантовые закономерности и т.д.
Итоговая таблица базовых измерительных шкал. Обсужденные выше шесть измерительных шкал не исчерпывают многообразия языков, на которых можно говорить о разнообразии реальности. Но они являются базовыми: остальные шкалы — производные от них, учитывающие некие сторонние, побочные, специфические условия. Для завершенности изложения важных особенностей базовых шкал приведем их сводную таблицу (табл. 5.2).
О других шкалах. Измерительная практика в разнообразных видах деятельности привела к целесообразности введения шкал, от-
личающихся от базовых. Учитывая предназначенность данного текста профессионалам любой специальности, ограничимся кратким перечислением наиболее употребительных модификаций измерительных шкал, чтобы при желании можно было найти более подробную информацию.
Очень распространены измерения непрерывных величин. Их значения поневоле фиксируются с конечной точностью, округленно. Особый случай представляют шкалы, когда конечное число разрядов определяется не разрядностью регистрирующего устройства, а классом точности измерительного устройства, когда увеличивать число разрядов бессмысленно. Оба типа шкал, в отличие от целочисленных дискретных шкал, называются дискретизованными. Обработка данных в дискретизованных шкалах имеет ряд особенностей.
Еще один практически важный класс шкал — нелинейные. Интервалы этих шкал не отвечают условиям аддитивности, т.е. «цена» единичного деления такой шкалы зависит от того, в какой части этой шкалы находится это деление. Примерами могут служить квадратичная, логарифмическая, экспоненциальная шкалы, «вероятностная бумага», многие номограммы.
Предпринимаются попытки заполнить пробел между «слабыми» (номинальной и порядковой) и «сильными» (числовыми) шкалами: шкала гиперупорядочения, шкала Черчмена — Акоффа.
В принципе каждый исследователь может построить собственную измерительную шкалу для лучшего представления результатов. Очень важно подчеркнуть, что каждая шкала должна сопровождаться перечнем допустимых операций первичной обработки, который специфичен для данной шкалы.
До сих пор речь шла о шкалах, основанных на четкой классификации: элемент либо принадлежал к классу, либо нет. Реальная жизнь привела к необходимости рассмотрения случаев, когда требование жесткой эквивалентности не выполняется, т.е. когда элемент может одновременно принадлежать к двум и более классам. Для описания таких ситуаций разработаны два подхода.
Первый основан на теории расплывчатых (нечетких) множеств. В этой теории принадлежность к классу описывается функцией принадлежности, которая характеризует степень уверенности, с которой мы относим объект к классу. Например, в какой степени сорокалетний человек относится к классу «молодые люди», а в какой степени к «немолодым»? В этой теории измерительной шкалой является шкала значений функции принадлежности.
Второй подход состоит в учете того, что распределения вероятностей классифицируемых переменных могут перекрываться. Принимая решение о принадлежности величины к тому или другому классу, мы рассекаем область значений переменной на четкие классы, в результате чего появляются вероятности ошибок (рис. 5.14). Обработкой случайных переменных занимается развитая область знаний — математическая статистика.
Рис. 5.14 |
При осуществлении эксперимента получаемый информационный «урожай» зависит от ряда факторов:
а) как был организован опыт, какие значения и в каком порядке придавались управляемым переменным;
б) каковы шумы, погрешности, искажения наблюдаемых переменных;
в) насколько справедливы предположения, заложенные в нашу модель исследуемой системы;
г) каковы способы, алгоритмы обработки полученных экспериментальных данных.
Значимость этих факторов различна в разных опытах, поэтому развиты специальные теории о том, как повысить качество выводов в зависимости от конкретной комбинации факторов. При необходимости можно обратиться к подходящей из них:
— теория интерполяции и экстраполяции;
— планирование эксперимента;
— непараметрическая статистика;
— робастные методы статистики;
— теория оптимизации;
— поиск и усиление закономерностей.
По этим ключевым словам можно найти в каталогах нужную литературу.
Зачем такие подробности? Действительно, предлагаемый текст адресован самому широкому кругу читателей: по убеждению автора, знание основ прикладного системного анализа необходимо, по крайней мере полезно, специалистам любой профессии. Ясно, что если дело дойдет до экспериментов, измерений и обработки полученных данных, особенно в сложных условиях, то редко кто станет все это делать сам, он обратится к специалистам, чтобы получить от них готовый результат.
Но практика показывает, что специалисты часто, пытаясь облегчить себе задачу, пренебрегают некоторыми тонкостями анализа данных, искренне полагая, что они несущественны. Типичным примером является нередко применяемая «оцифровка» качественных данных — классам в порядковой и номинальной шкалах присваиваются номера, а дальше эти номера обрабатываются не как символы, а как числа, с помощью арифметических операций. Но ведь это недопустимые операции для этих шкал! Другой пример — ослабление данных для приведения их к однообразию. В таблице с разношкальными данными сильные шкалы огрубляются до самой слабой (обычно порядковой), так что протокол эксперимента становится одношкальным, что облегчает обработку. В отличие от оцифровки, здесь происходит не навязывание чуждой информации, а отказ от части полезной. Это тоже снижает качество выводов.
Главной задачей при изложении данного этапа является направить внимание пользователя услуг по проведению экспериментов на проверку того, а не случилось ли использования недопустимых операций при обработке данных. Например, все числовые шкалы оперируют цифрами. Но мы уже знаем, что цифры в шкале интервалов, отношений и абсолютной должны обрабатываться по-разному. При приемке заказа рекомендуется посмотреть, нет ли в алгоритме обработки недопустимых операций.
Еще один важный момент следует иметь в виду — речь идет о согласовании информационной силы измерительной шкалы с информационным потенциалом наблюдаемого явления. Чем сильнее шкала, тем больше «информационный урожай» с эксперимента. Поэтому каждый экспериментатор старается использовать как можно более сильную шкалу. Но ведь нельзя наблюдение с произвольно устанавливаемым нулем считать принадлежащим к шкале отношений. Таким образом, при прямых наблюдениях желательно шкалу измерений делать посильнее, но не сильнее самой природы явления.
Дело еще более осложняется при косвенных наблюдениях. Наблюдаемая величина, косвенно связанная с интересующим нас ненаблюдаемым явлением, может принадлежать к любой, в том числе и к самой сильной шкале; тогда как информационный потенциал самого явления может быть существенно ниже. Как обрабатывать данные эксперимента? Ответ состоит в том, чтобы при обработке косвенных данных, в сколь бы сильной шкале они ни фиксировались, не употреблять операций, недопустимых в шкале, отвечающей природе исследуемого явления. Приведем один шутливый и два серьезных примера.
Пусть мы решили измерить силу материнской любви. Прямому измерению эта характеристика не поддается, но можно фиксировать количество поощрений и наказаний, которыми мать наделяет дитя в день. Количество шлепков и конфеток фиксируются в самой сильной — абсолютной (!) шкале. Гипотеза состоит в предположении, что эти величины связаны монотонно с силой любви матери к дитяти. Но если у одной мамы соответствующие характеристики лучше, чем у другой, неправомерно заключить, что она в два раза сильнее любит свое дитя; можно только сказать, что она сильнее любит, так как сила любви принадлежит к качественной, порядковой шкале.
Второй пример взят из медицины. За показатель интенсивности патологического процесса принимается скорость выпадения осадка при добавлении в пробирку с кровью цитрата натрия; скорость осаждения измеряется в миллиметрах в единицу времени. Эта идея основана на том, что увеличение интенсивности воспаления приводит к повышению содержания глобулина, что увеличивает скорость выпадения осадка. Функциональный вид этой связи неизвестен, для разных пациентов различен и нелинеен: изменение пропорции цитрата натрия или времени осаждения приводит к непропорциональным изменениям высоты осадка. Теперь пусть для одного больного лекарство А привело к уменьшению осадка (за 10 минут) с 75 до 60 мм, а для другого лекарство В — с 65 до 55 мм. И время осаждения, и высота осадка измеряются в шкале отношений. Но отсюда нельзя заключать, что лекарство А эффективнее, так как оно привело к уменьшению осадка на 15 мм, а лекарство В — только на 10! Интенсивность воспаления принадлежит к порядковой шкале.
Третий пример — испытание умственных способностей, при котором измеряется время, затрачиваемое испытуемым на решение тестовой задачи. В таких экспериментах время хотя и измеряется в числовой шкале, но как мера интеллекта принадлежит к порядковой шкале.
Итак, главный пафос изложения данного этапа системного анализа направлен на то, чтобы при необходимости экспериментального исследования системы, с которой вам приходится работать, вы, сами ли будете осуществлять эксперименты, или будете заказывать их другим лицам, проверили бы, правильно ли обработаны экспериментальные данные.
Контрольные вопросы и задания
1. Что такое «активный» и «пассивный» эксперименты?
2. Чем отличаются прямые и косвенные измерения? Как следует учитывать разницу между ними при обработке данных эксперимента?
3. Усвоили ли вы характерные особенности базовых измерительных шкал? Например, заметили ли вы, что количественные шкалы различаются способами задания начал отсчета и единиц измерения?
4. Почему не следует всегда одинаково обрабатывать данные, относящиеся к разным измерительным шкалам?
5. Попробуйте опознать, в каких шкалах сделаны записи в каждом столбце на странице вашей зачетной книжки.
Еще по теме 5.8. Этап восьмой. Экспериментальное исследование систем:
- Уровни научного исследования
- 3. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ ПО УСТАНОВЛЕНИЮ ВОЗМОЖНОСТИ КОМПЛЕКСНОЙ ПЕРЕРАБОТКИ ТРУДНООБОГАТИМЫХ ЗАБАЛАНСОВЫХ МЕДНО-МОЛИБДЕНОВЫХ РУД ЖИРЕКЕНСКОГО МЕСТОРОЖДЕНИЯ
- 4.5.1. Постановка экспериментальных исследований
- 5.2. 1. Экспериментальные исследования сорбционной способности каолинита
- 38. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ. ЭКСПЕРИМЕНТАЛЬНЫЕ СТРАТЕГИИ
- 39. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
- Глава 1. ОБЪЕМ ПОНЯТИЯ «ЭКСПЕРИМЕНТАЛЬНАЯ ПСИХОЛОГИЯ»
- 3. Применение статистических методов и средств формализации в психолого-педагогическом исследовании
- Экспериментальное исследование
- 2.3. Обратимые и необратимые деградационныепроцессы в зонах промышленного воздействияна окружающую среду
- Раздел III Результаты экспериментальных исследований и практические рекомендации по определению профессиональной пригодности