От перцептрона до ChatGPT

—  Как нейросети из научной фантастики превратились в обыденность?

Вот что найдено по запросу «Расскажи историю нейросетей»…       

Нейросети стали уже будничным явлением. Сообщения о том, что ИИ научился копировать человеческий голос, диагностировать психические расстройства или шутить, мы воспринимаем как обычное, закономерное событие. Порой новостей так много, что аудитория просто устает от них. Однако так было не всегда и еще десятилетие назад даже малейшие продвижения в разработке нейросетей считались научным прорывом.

Как так получилось и какой путь прошел ИИ, прежде чем стать частью повседневности – рассказываем!

Как гипотезы стали первыми моделями?

Первыми попытались смоделировать работу нашего мозга американские ученые Уоррен Маккалок и Уолтер Питтс. В 1943 году они представили математическую модель нейрона. Часто ошибочно полагают, что такой нейрон – точная копия биологического. В действительности он похож на свой прототип примерно так же, как самолет на птицу. Внешнее сходство не так очевидно, однако функционально он способен достаточно точно симулировать внутренние процессы нейрона.  Революционное открытие стало отправной точкой для многих других исследователей.

В 1948 году американский математик Норберт Винер издал книгу о кибернетике, а в 1949 году канадский физиолог Дональд Хебб представил нейропсихологическую теорию, в частности описал ансамбли клеток – биологическую основу обучения.

Британский кибернетик Алан Тьюринг первым заявил, что компьютер может обучаться самостоятельно. Он предположил, что компьютер «мыслит», если человек в процессе общения с ним не догадывается, что говорит с машиной. Позже этот эксперимент назвали тестом Тьюринга. На этом же принципе построен тест CAPTCHA, который заставляет нас из раза в раз искать светофоры и велосипеды на картинках.

Следующим важнейшим этапом стала разработка перцептрона. Перцептрон – простая модель машинного обучения, имитирующая восприятие информации нашим мозгом. В 1957 году Фрэнк Розенблатт представил первую обучаемую нейросеть. Он помогал компьютерам обучаться на основе различных данных, мог прогнозировать погоду и распознавать образы.

Неидеальный перцептрон

Со временем стало ясно, что изобретение Розенблатта примитивно и необходимо новое, более продвинутое. В 1960-х в СССР Михаил Бонгард и Александр Петров параллельно писали о бесперспективности перцептрона и проблемах в визуальном распознавании объектов. Позже американец Марлин Ли Минский опубликовал статью, доказывающую проблемы перцептрона с инвариантностью представлений, иными словами, нейросеть была неспособна различать объекты вне зависимости от внешних факторов.

В 1974 году американец Пол Джон Вербос и россиянин Александр Галушкин параллельно открыли алгоритм обратного распространения ошибки. Этот метод со временем станет основой для обучения нейросетей. Затем почти на десятилетие к алгоритму не возвращались: технические возможности тех лет не позволяли развивать идеи дальше. За это время Джон Джозеф Хопфилд и Теуво Кохонен представили свои наработки в сфере нейросетей, которые вывели исследования на новый уровень. Однако технологической революции вновь не случилось – по-прежнему подводила вычислительная мощность компьютеров. К алгоритму вернулись только в 1986 году: ученые из США и СССР развили его и доработали.

IMG_8562
Иллюстрация: freepik.com
Deep Learning: нейросети становятся умнее

После резкого взлета последовал спад: до начала 2000-х интерес к нейросетям снизился, а финансирование проектов сократилось. Этот период назвали «зимой» искусственного интеллекта. Все изменилось с появлением мощных графических процессоров: компьютер получил возможность обрабатывать куда больше данных и справляться с более трудными задачами. Нейросети стали применяться в крупных компаниях, таких как Google и Microsoft.

Одним из первых успехов стала предиктивная система набора текстов, она же – Т9. Технологию разработали в США в компании Tegic Communications и впервые применили в телефоне модели Sagem MC 850 в 1999 году. Т9 позволяла набирать текст на клавиатуре телефона, состоящего только из цифр. Отсюда и название – «text on 9 keys», или набор текста на девяти кнопках. Сегодня эта технология уже ушла, однако название осталось: часто так ошибочно называют функцию автозамены. Она, в отличие от Т9, анализирует уже написанный текст и предлагает наиболее вероятные варианты его продолжения.

В 2010-х по-настоящему популярным стало направление Deep Learning. Несмотря на то, что многие методы глубокого обучения ИИ были известны еще в 1980-х, большие успехи пришли к технологии только спустя три десятилетия. Этот способ, отличается тем, что нейросеть обучается самостоятельно на основе большой базы данных. Именно по такому принципу «готовили» ChatGPT, YandexGPT и GigaChat (но о них позднее). Простыми словами, глубокое обучение позволяет нейросети справляться с еще более сложными задачами: распознавать речь, создавать картинки и тексты или различать объекты. Главное, к технологии вновь вернулся интерес, а вместе с ним – финансирование.

А что сейчас?

Долгожданным прорывом стала совершенно новая архитектура нейросетей – трансформер. Технология разработана Google Brain в 2017 году. Именно на ней строится работа языковых моделей – ChatGPT, YandexGPT и подобных.

Уже в 2020 году появляется нашумевший алгоритм GPT-3 (Generative Pretrained Transformer 3), разработанный OpenAI. Третье поколение GPT стало самой крупной языковой моделью и по заверениям разработчиков могло справляться с любой текстовой задачей на английском языке. Однако вскоре лидерство перешло к еще более продвинутой нейросети – ChatGPT, так же от OpenAI. Чат-бот был запущен в ноябре 2022 и за два месяца собрал более 100 миллионов пользователей, став самым быстрорастущим интернет-сервисом в истории. В марте 2023 платным подписчикам сервиса стала доступна модель GPT-4, которая теперь могла работать и с картинками. 

В апреле и мае 2023 года в России вышли GigaChat и YandexGPT – сервисы Сбера и Яндекса. Функционал и принцип работы остались те же, качество местами уступает, а порой и превосходит предшественника.

С разработкой GPT-5 пока сложнее: весной того же 2023 года быстрое развитие ИИ обеспокоило общественность и экспертов. Открытое письмо с требованием остановить на некоторое время разработку сверхинтеллекта подписали 33 тысячи человек, включая Илона Маска и Стива Возняка. Но разработка технологии все же ведется и, вероятно, она скоро станет доступна пользователям. 

Так, почти за 70 лет перцептрон, способный отличать зеленые яблоки от красных, превратился в мощные языковые модели, которые продолжают постоянно совершенствоваться. О будущем ИИ говорить сложно: одни исследователи видят в технологии большой нераскрытый потенциал, другие – угрозу, которую нужно немедленно остановить. Однако эксперты отмечают, что технология будет лишь прочнее внедряться в нашу жизнь, охватывая новые сферы.


Фото на обложке: freepik.com