Так что, когда я приехал в город Лос-Гатос, штат Калифорния, в штаб-квартиру Netflix, расположенную в здании с красной черепичной крышей – оно напоминало то ли старый Голливуд, то ли гостиницу «Ла-Квинта», – в голове у меня были только звездочки. Это стало почти навязчивой идеей. Вы не поверите, сколько времени я провел, размышляя, стоит ли смотреть фильм, если его прогнозируемый рейтинг составляет 2,9 (а дистанция от 2,9 до 3,0 – ну совсем ведь маленькая!). Посмотреть фильм, рейтинг которого «единица», казалось чуть не преступлением. А когда мне удавалось обнаружить фильм, которого я не видел, но его прогнозируемый рейтинг был 4,7, я чуть не под облака взмывал от радости!

Я знал, что я не один такой: компания в рамках своего знаменитого проекта «Оптимизация алгоритма» предложила приз в миллион долларов ученым-программистам, которые смогут дать десятипроцентное улучшение для прогнозируемых рейтингов Netflix. Множество умных людей посвятили множество часов, размышляя о так называемой «проблеме «Наполеона Динамита», или что делать с фильмами, которые делят зрителей на два противоположных вкусовых лагеря и реакция на которые крайне слабо прогнозируема. Я подумал, что здесь, в Лос-Гатосе, я увижу доброжелательную «Штази» вкусов, в которой знают все о том, как люди смотрят кино, где хранится громадный массив данных о человеческих предпочтениях. Я хотел знать то, что является очень личным и что, как я думал, они мне не расскажут: насколько чувствителен этот алгоритм к оценкам – если я поставил 2,7 фильму, для которого Netflix предсказал мою оценку как 3,2, как быстро такое отклонение повлияет на мое собственное рейтинговое поле? Какой фильм обладает самым широким спектром крайне негативных и крайне позитивных оценок?

Вот почему я уже практически слышал, как скрипит мое перо по бумаге, когда уселся напротив вице-президента по новым разработкам Тода Елина в переговорной «Лучший стрелок» (все офисные помещения Netflix носят названия фильмов или телешоу) и он начал свой рассказ: «Моя первая должность в компании – директор по персонализации продукта. Я возглавил работы по получению оценок, по улучшению прогнозов на основании этих оценок; мы придумывали, где именно в пользовательском интерфейсе их надо размещать». Что ж, полет нормальный. Затем он сказал: «Со временем, при расширении области персонализации, мы стали придавать прогнозируемым оценкам гораздо меньшее значение».

Потребовалось некоторое время, чтобы до меня дошло. Меньшее значение?! Видимо, в тот момент я выглядел слегка пришибленным. Думаю, Елин почувствовал мое разочарование. Я приехал, чтобы узнать о самом сложном в мире техническом средстве прогнозирования вкусовых предпочтений в кино, а мне говорят, что вопросам вкуса – по крайней мере выраженным с помощью рейтингов – здесь придают «меньшее значение»! «Нигде во Вселенной не жмут так много на «звездочки» фильмов и телешоу, как у нас! – рассказал Елин. – И мы разработали множество алгоритмов для повышения точности этих предсказаний». Но, как он сказал, это было «последним писком» году этак в 2005-м или в 2006-м. И мои смешные вопросы о «звездочках» тут же стали ужасно отдавать стариной. Значит, вложив такую бездну времени и усилий в постройку совершенной системы рекомендаций на базе оценок, Netflix от нее отказалась?

Не совсем. «Люди по-прежнему выставляют оценки, мы считаем эту информацию полезной. Просто она – второстепенная», – говорит Елин. Случилось сразу две вещи, которые затмили пользу «звездочек». Первая, как рассказал Ксавье Аматриайн, руководитель по системе рекомендаций, – компания вплотную приблизилась к некоей конечной скорости прогнозирования вкусов. «Как часто бывает при работе с алгоритмами, – рассказал он, – 20 % времени уходит на достижение 90-процентной точности; а затем уже 80 % времени уйдет на обеспечение оставшихся 10 % точности». Было совершенно непонятно, стоит ли инвестировать в работу над этими оставшимися 10 %, что привело бы к еще большему усложнению рекомендательной системы, в которой и без того уже работала и «Ограниченная машина Больтцмана», имелись и «Случайные леса», и «Латентные размещения Дрихле», – будет ли это оправданно?