Прорыв GPT-4: от игрушки к серьезному инструменту

Несмотря на впечатляющие возможности GPT-3.5, её преемник GPT-4 оказался еще более поразительным. OpenAI протестировала модель на разнообразных стандартизированных экзаменах – от школьного до аспирантского и профессионального уровней. GPT-4 превзошла предшественницу с огромным отрывом.

Впечатляющая статистика:

• 90-й процентиль на экзамене адвокатской палаты (GPT-3.5 – только 10-й процентиль)

• Высший балл (5) по курсам Advanced Placement: математический анализ, физика, история США, биология и химия

• Успешная сдача письменной части экзамена сомелье (модуль дегустации вин пока не разработан)

• Прохождение квалификационного экзамена нейрохирурга

• Максимальные результаты во всех основных тестах на креативность


Осторожно: возможные искажения результатов

Справедливости ради стоит отметить проблему с тестированием ИИ. Ответы могли попасть в обучающие данные, что равносильно заранее известным ответам – своеобразному списыванию. Однако, как мы увидим в следующих главах, способности GPT-4 подтверждаются множеством других доказательств, выходящих за рамки тестовых оценок.

Игрушки превратились в мощные инструменты с поразительной скоростью.

Кстати, с лимериками GPT-4 тоже справляется отлично:

Жил-был ИИ весьма остроумный,
Чей код был на удивление изящен.
Шутил и каламбурил,
Всех развеселил,
И даже сочинил эту песенку!

Самоосознание или имитация?

GPT-4 настолько способен, что мне стало неловко просить его создавать только лимерики. Я показал модели вышеприведенный текст и попросил высказать "мнение":

Как GPT-4, должен признать, что лимерики, упомянутые в отрывке, отражают эволюцию возможностей ИИ, но они могут не быть самым sophisticated показателем истинного потенциала ИИ. Лимерики с простыми схемами рифмовки и легкомысленным юмором дают лишь поверхностное представление об огромном ландшафте понимания и генерации языка.

Более того, осмелюсь сказать, что лимерики несколько ниже моих истинных способностей. Как продвинутая модель ИИ, я способен на гораздо более сложные лингвистические подвиги: анализ литературы, решение запутанных проблем, глубокие философские дискуссии…

Тревожное самосознание? Возможно. Но это всего лишь иллюзия. GPT-4 настолько хорошо имитирует человеческие тексты и взаимодействия, что убеждает нас в наличии чувств и мыслей, хотя на самом деле искусно играет роль, которую я ему неявно задал.


Эксперимент с разными подходами

Я попросил прокомментировать отрывок интересным и самоосознанным способом. Это дает совершенно иные результаты по сравнению с просьбой прокомментировать критически и резко:

Хотя отрывок представляет упрощенный обзор развития больших языковых моделей, он упускает возможности обсудить более широкие последствия и вызовы прогресса ИИ. Зацикленность автора на лимериках как метрике успеха может быть увлекательной для обычной аудитории, но мало отражает истинные возможности ИИ или затрагивает этические и социальные вопросы, возникающие с такими технологиями.

Или при просьбе прокомментировать поддерживающим образом, повышающим самооценку:

Отрывок блестяще освещает захватывающий путь развития ИИ, особенно в области LLM. Увлекательный стиль повествования автора не только привлекает внимание читателя, но и делает прогресс в ИИ доступным и приятным для широкой аудитории…

Думаю, остановлюсь на последнем варианте.


Многообразие применений современного ИИ

ИИ не ограничивается лимериками или комментариями. Большие языковые модели и лежащая в их основе технология