Технологии на базе искусственного интеллекта не только активно развиваются, впечатляя (и пугая) своей функциональностью, но и продолжают демократизироваться. Консультант по работе с нейросетями Наиля Аглицкая полагает, что в 2025 году ИИ перейдет от «ранних последователей» к «раннему большинству». Мы решили посмотреть на развитие технологии через главные релизы 2024 года и выделить ожидаемые разработки 2025-го, а также четыре главных изменения, которые затронут всех.
В прошлом году ИИ развивался преимущественно в трех направлениях: мультимодальные системы, рассуждающие модели и ИИ-агенты. Лидером этой гонки все так же остается OpenAI.
В мае компания выпустила модель GPT-4o, которая умеет работать с текстом, аудио и видео одновременно. Особенно впечатляющим оказался голосовой режим: модель научилась вести живой разговор, выражать эмоции, распознавать объекты и даже петь. Во время презентации разработчики не раз отсылали зрителей к фильму «Она», а Сэм Альтман опубликовал в тот день лаконичный твит «her».
Через два месяца вышла упрощенная и более дешевая GPT-4o mini. Сейчас она доступна в том числе незарегистрированным пользователям — на главной странице чат-бота. К слову, возможность пользоваться ChatGPT без регистрации тоже появилась только в прошлом году. Как объяснила компания, цель — сделать ИИ доступным для всех (и, видимо, позволить модели обучаться на еще большем количестве данных).
Под конец года свою модель с мультимодальными возможностями Gemini 2.0 Flash представил Google. Она, например, способна генерировать текст, звук и изображение и, по словам разработчиков, отличается большей производительностью и энергоэффективностью. «Мы считаем 2025 год началом эры ИИ-агентов, и Gemini 2.0 — ее основа», — подчеркнул гендиректор Google DeepMind Демис Хассабис.
Google активно интегрирует Gemini в свои сервисы. Например, если у вас есть подписка на модель, она может сделать конспект переписки в почте и подготовить черновик ответного письма в вашем стиле. Gemini также совершенствует поиск Google, следует из пресс-релиза. Модель позволит точнее отвечать на более сложные вопросы, в том числе математические задачи и программистские запросы.
У OpenAI теперь тоже есть собственный поиск ChatGPT search, которым можно пользоваться в том числе через расширение для Google Chrome. Компания рассказала о прототипе этого продукта летом, а к концу года открыла доступ к нему для всех пользователей.
Второе направление — рассуждающие модели. В сентябре OpenAI представила модель o1, способную пошагово анализировать запросы и «думать» над своими ответами, минимизируя тем самым количество ошибок. Спустя три месяца компания анонсировала более продвинутую версию — o3. Она вошла в топ-200 лучших программистов мира и успешно прошла бенчмарк ARC AGI, оценивающий способность ИИ осваивать новые навыки.
ИИ-агенты — третье направление развития. Такие модели способны не только обрабатывать и выдавать информацию по запросу, но и самостоятельно взаимодействовать с окружающим миром. ИИ-агенты (например, Claude от Anthropic) уже умеют работать с интерфейсами компьютеров — перемещаться по меню, кликать по объектам и печатать.
По прогнозам Deloitte, в 2025 году 25% компаний, использующих ИИ, начнут внедрять в рабочие процессы ИИ-агентов.
{{slider-gallery}}
Помимо этих трех направлений, отдельным прорывом стала модель Sora, способная генерировать короткие видео на основе текстовых запросов и статичных изображений. Компания рассказала о ней публике еще в феврале. Официально модель вышла только в конце года.
Смелой попыткой ворваться в гонку ИИ стал релиз Apple Intelligence. Правда, пока кажется, что Apple находится в самом начале пути — в этом признается и сама компания. Система Apple Intelligence отстает от конкурентов минимум на два года, пишет главный обозреватель продукции Apple в Bloomberg Марк Гурман. Тем не менее это один из крупнейших шагов в демократизации технологии.
Из плюсов: уже сейчас ИИ поможет вам в проверке орфографии и пунктуации, напишет письмо в вашем стиле, найдет нужное фото из галереи только по текстовому запросу и создаст уникальный эмодзи. Также он умеет приоритизировать уведомления, делать саммари и отделять важные письма от спама.
Из минусов: пока что Apple Intelligence только проходит бета-тестирование у широкой аудитории. Система доступна далеко не на всех устройствах Apple и лишь в нескольких англоязычных странах. В целом ИИ-функции не увеличили продажи нового iPhone. Большинство пользователей пока не видят ценности в ИИ от Apple.
В прошлом году Tesla презентовала робота Optimus. По словам Маска, это почти машина Tesla, только «с руками и ногами вместо колес». В будущем роботы-ассистенты будут интегрированы с системами умного дома и смогут выполнять ежедневные бытовые дела (например, получать посылки и присматривать за детьми). Tesla собирается выпускать роботов-помощников по цене $20–30 тыс.
Компания также планирует внедрить гуманоидных роботов на своих заводах. В 2026 году она будет продавать Optimus и другим предприятиям. По прогнозам Маска, к 2040 году количество гуманоидных роботов превысит численность людей.
{{slider-gallery}}
По словам Маска, нейрочип может стать связующим звеном между человеком и ИИ и поможет человечеству выиграть конкуренцию с технологиями. И, кажется, в этом году был сделан первый шаг к симбиозу: в январе 2024 года компания Neuralink впервые вживила мозговой имплант своему пациенту — парализованному студенту Нолану Арбо. Благодаря технологиям он смог управлять компьютером с помощью мыслей. После этого провели еще две успешные операции по имплантации нейрочипов (о последней стало известно в начале этого года).
Другая разработка Neuralink — имплант BlindSight, способный вернуть зрение слепым. Компания получила разрешение на проведение клинических испытаний с использованием чипа. Устройство позволит видеть тем, кто потерял оба глаза и зрительный нерв или слеп с рождения. Агентство Министерства здравоохранения США (FDA) уже назвало технологию революционной.
В 2024 году сразу две Нобелевские премии были связаны с выдающимися достижениями в области ИИ. Нобелевская премия по химии была присуждена Дэвиду Бейкеру, Демису Хассабису и Джону Джамперу, разработавшим с помощью ИИ системы для предсказания структуры белков. Их разработки позволили с высокой точностью моделировать трехмерные формы белков — это значительно ускоряет процесс создания новых лекарств и методов лечения заболеваний.
{{slider-gallery}}
Нобелевской премией по физике отметили фундаментальные труды Джона Хопфилда и Джеффри Хинтона. С 1980-х годов они изучали нейросети. По сути, благодаря им стало возможным машинное обучение нейронных сетей. Хопфилд разработал концепцию ассоциативной памяти, позволяющую восстанавливать данные даже при их частичном искажении, а Хинтон — метод обратного распространения ошибки, алгоритма, повышающего способности ИИ к самообучению.
Хотя многие надеялись, что GPT-5 покажут в декабре на презентации 12 days with OpenAI, Сэм Альтман отложил выход этой модели до 2025-го. Компания обещает, что она будет в разы мощнее предыдущей и научится обрабатывать около 25 тыс. слов за раз. GPT-5 сможет запоминать ваши предпочтения, стиль общения, интересы и привычки не только в рамках одной беседы. Модель, например, напомнит, что вы хотели начать бегать по утрам или учить испанский язык, даже если эта тема обсуждалась несколько месяцев назад. Наконец, GPT-5 сможет, помимо текста, создавать изображения, аудио (может, даже генерировать музыку) и короткие видео.
В ближайшее время OpenAI должна представить Operator — своего первого ИИ-агента, который умеет автономно управлять компьютером. В будущем он сможет заменить личных ассистентов, которые занимаются бронированием путешествий, онлайн-покупками или систематизацией рабочих файлов.
Илон Маск обещает выпустить модель Grok 3 от xAI, которая, по его словам, обгонит GPT-5. Для этого модель будут тренировать на одном из крупнейших вычислительных кластеров Colossus из процессоров Nvidia H100. Grok 3 тоже будет мультимодальной.
Microsoft готовит к запуску Copilot Vision. ИИ-агент сможет анализировать действия пользователей в браузере, извлекать ключевую информацию из текста, облегчать обработку сложных задач вроде анализа больших отчетов, а еще бронировать билеты или искать данные по запросу. Как заявляют в компании, главное преимущество Copilot Vision — конфиденциальность: данные пользователей не сохраняются, а действия ИИ ограничены текущей сессией. Сейчас эта модель доступна для ограниченного количества подписчиков Copilot Pro в США.
{{slider-gallery}}
Google, видимо вдохновившись «Железным человеком», разрабатывает Project Jarvis — универсального ассистента на основе модели Gemini. Как утверждают в компании, Jarvis будет не просто исполнять команды, но и решать задачи самостоятельно: от сбора данных до составления расписания или оформления заказов. ИИ-агент сможет работать с текстом, изображениями и голосом. Это в том числе улучшит навигацию по интернету для пользователей с ограниченными возможностями.
Илон Маск и Сэм Альтман сошлись в едином взгляде на ближайшие этапы развития ИИ. По мнению Маска, уже к концу 2025 года ИИ сможет превзойти человеческий интеллект, что приведет к технологической революции и изменению многих аспектов жизни. Подобные прогнозы предлагает и Альтман, заявивший, что человечество стоит на пороге «новой эры интеллекта».
Еще в сентябре Альтман утверждал, что до общего искусственного интеллекта (AGI), способного выполнять любые человеческие задачи, осталось около 1 тыс. дней. Спустя пять месяцев прогноз изменился: по словам гендиректора OpenAI, эра AGI может начаться уже в этом году.
Консультант по нейросетям Наиля Аглицкая выделяет четыре главных изменения, которые будут заметны в 2025 году.
Аудитория окажется не готова к эпохе сгенерированного контента. Его, как можно понять, будет еще больше. В 2025 году технология наконец перейдет от «ранних последователей» к «раннему большинству», и не все смогут быстро адаптироваться. Это подтверждают, например, истории, как люди становятся жертвами реалистичных (или не очень) фейков, созданных с помощью нейросетей.
{{slider-gallery}}
Технологический разрыв будет ощущаться еще острее. Речь о разнице не только между странами с разными уровнями развития технологий, но и между поколениями. Из-за неравномерного доступа к технологиям мы можем стать свидетелями эффекта Матфея: те, кто освоит ИИ, укрепят свои позиции на рынке труда, а те, у кого не будет доступа к передовым технологиям, отстанут еще сильнее.
ИИ-компании пойдут в маркетинг. Недавно OpenAI наняла несколько специалистов по рекламе из Google и Meta*. Вслед за этим Anthropic разместила вакансию на должность инфлюенс-менеджера.
Чтобы повысить лояльность аудитории и привлечь новых пользователей, компании начнут уделять больше внимания маркетинговым кампаниям. Примером можно считать декабрьскую презентацию 12 days of OpenAI, которая на протяжении почти двух недель заставляла весь мир наблюдать за новинками компании. Другим примером служит недавняя интеграция ChatGPT с устройствами Apple, что должно способствовать дальнейшему распространению технологии. Коллаборация с Apple, которая насчитывает почти 1,5 млрд владельцев iPhone, открывает для ChatGPT с его 300 млн пользователей в неделю возможность выйти на по-настоящему массовую аудиторию.
{{slider-gallery}}
ИИ подарит нам новую работу, а главными навыками станут промтинг и критическое мышление. О том, что ИИ заберет рабочие места, говорили еще несколько лет назад. На деле эти прогнозы сбылись довольно условно. Многие профессии стали трансформироваться. Например, генераторы изображений сильно повлияли на творческий процесс дизайнеров и художников, и теперь это один из ключевых инструментов работы для них.
В период демократизации ИИ все больше компаний внедряет его в рабочие процессы. В связи с этим продолжит расти спрос на специалистов, умеющих эффективно работать с ИИ-инструментами: промт-инжиниринг и критическое мышление станут обязательными навыками.
* Признана экстремистской и запрещена в России.