Ну, будете ли вы участвовать? Вам пора принимать решение.
Оригинальные материалы этой первой обучающей ситуации предоставляют более подробные данные для принятия решения, а здесь я передал самую суть. Пока студенты в аудитории читают текст, я три раза предупреждаю их: «Если вам нужна дополнительная информация, скажите мне об этом». Нужна ли дополнительная информация вам? Например, если бы вы захотели узнать, связан ли отказ прокладки с температурой воздуха, какие данные вам бы понадобились?
Большую часть студентов, как правило, не интересует дополнительная информация, и многие из них решают участвовать. Они приходят к выводу, что шансы на возникновение проблемы составляют 7 из 24, тем более что и главный механик говорит: в ремонтной яме гонки не выигрывают. Мои студенты принимают во внимание потенциальную проблему низкой температуры, но считают, что данные по ней неубедительны.
Мало кто желает получить критически важную информацию, необходимую для проверки температурной гипотезы. Какие данные нужны тому, кто хочет узнать, действительно ли отказ двигателя связан с погодными условиями: температура, при которой двигатель отказывал, температура, при которой он работал исправно, или и та и другая? Любой, кто разбирается в двигателях, или имеет представление о статистике, или просто умеет логически мыслить, скажет: и та и другая. Однако, несмотря на то что учащимся несколько раз говорят: «Если вам нужна дополнительная информация, задавайте вопросы», большинство из них не спрашивают, при какой температуре воздуха двигатель работал исправно.
Тем немногим, кто интересуется температурой воздуха во время заездов, не отмеченных отказом прокладки, я даю дополнительный пакет информации. Они узнают, что во время удачных гонок температура воздуха составляла 18, 20, 20, 22, 23, 26, 26, 27 градусов Цельсия, кроме того, две гонки проходили при температуре 21 и 24 градуса и три – при 19 градусах.
Меняет ли это картину? Теперь вы имеете возможность заметить, что команда не дошла до финиша во всех гонках, приходивших при температуре ниже 18 градусов Цельсия, и что между низкой температурой воздуха и отказом прокладки заметна очень высокая корреляция. График на рис. 1 поможет вам увидеть этот алгоритм.
Более того, учитывая данные всех 24 гонок, вы увидите, что вероятность отказа в грядущем заезде согласно логистической регрессии превышает 99 %. Но если у вас нет информации об удачных гонках, то вы не заметите закономерности. Большинство студентов принимают решение об участии без этих данных, потому что не спрашивают о них.
Если вы не знаете, как строить логистическую регрессию, не расстраивайтесь. Вам это и не нужно. Метод «на коленке» тоже сработает. Может быть, вас убедит табл. 1.
Рис. 1. Отказ прокладки при разных температурах
Если один из присутствующих в классе дает правильный ответ, поскольку запросил данные по остальным 17 гонкам, другие студенты начинают возражать. Они возмущаются, что распределение данных не было справедливым. Я напоминаю, что три раза повторил: «Если вам нужна дополнительная информация, задавайте вопросы». Студенты отвечают, что, когда они работали над другими ситуациями, профессор всегда предоставлял им все необходимые данные для решения проблемы. Они правы. Но в жизни часто бывает так, что нам кажется, будто нам дали всю информацию, однако для того, чтобы принять правильное решение, чего-то не хватает, и мы вынуждены запрашивать дополнительные сведения.