.gif)
Анастасия Янина
«Маркетплейсы из витрин эволюционируют в персональных шопинг-ассистентов»


Умные рекомендации, персонализированная товарная корзина и поиск, который предугадывает желания, — за эти и другие функции в Wildberries & Russ отвечают большие языковые модели, которые развивает команда Анастасии Яниной. К 31 году Настя успела поработать с Meta*, Lyft, Samsung, «Яндексом» и T-Банком, получить ученую степень, выпустить несколько книг и онлайн-курсов по машинному обучению. А сейчас параллельно с работой в крупнейшем маркетплейсе страны преподает в Москве, Барселоне и Бангкоке. SETTERS Media поговорило с ней об ИТ-образовании, о шансах России на «свой» OpenAI и главных вызовах онлайн-ретейлеров.
«В машинном обучении сошлось все, что меня драйвит»
С чего начался твой путь в науку?
Еще в школе я увлеклась научными исследованиями. В старших классах занималась разработкой биодатчиков и костных протезов на основе пористого кремния — на кафедре физики твердого тела в Самарском университете. Мы тогда с командой написали первую научную статью.
Затем поступила в МФТИ, а примерно на третьем курсе погрузилась в машинное обучение. В нем сошлось все, что меня драйвит: математика, разработка и наука.
Почему именно МФТИ и как учеба там повлияла на карьеру?
У физтеха есть особенность — кафедры, которые открываются совместно с ИТ-компаниями. Мою кафедру курировал «Яндекс»: занятия вели разработчики и аналитики, делились живыми кейсами и ошибками. На четвертом курсе я присоединилась к их команде в качестве аналитика-исследователя.
Чуть раньше, на третьем курсе, поступила в Школу анализа данных «Яндекса». Там нашла единомышленников, многие мои однокурсники до сих пор рядом: кто-то стал коллегой, кто-то — другом. Там же встретила и научного руководителя, с которым работаем уже больше десяти лет.
А главное, там я поняла: мне близка прикладная наука. Это интересно, это работает, и у меня это получается.
Каким был твой первый серьезный проект?
Многие годы я работала над системой семантического поиска — она находит тексты, близкие по смыслу, а не просто по ключевым словам. На основе этой технологии мы собрали поисковый индекс по научным статьям для агрегатора Semantic Scholar и arXiv.org. Там миллионы публикаций по множеству дисциплин, от физики до экономики.
Наша система не просто ищет, но и анализирует: поддерживает так называемый разведочный поиск. То есть ей можно не только задать вопрос, но и загрузить целый текст или даже подборку документов — и она найдет похожие ключевые идеи, укажет на пробелы. Эдакий инструмент от ученых для ученых — с ним куда проще анализировать, быстрее ориентироваться в потоке новых публикаций.
С этим проектом и получила PhD?
Да, диссертацию писала на эту тему: исследовала, как с помощью нейросетей превратить тексты в числовые векторы, то есть в формат, понятный алгоритмам. Без этого наш поисковик не заработал бы.
Это было еще до того, как стали популярны большие языковые модели, которые сейчас во многом берут на себя такие задачи и часто справляются с ними даже лучше.
Как академический бэкграунд помогает работать с крупным бизнесом?
Это необходимое условие для исследователей ИИ: постоянно развиваться и в академии, и в индустрии.
Я начала преподавать, когда еще училась в магистратуре физтеха, в 2017 году, и сейчас продолжаю: читаю лекции и научно руковожу студентами в МФТИ и Harbour.Space University, записываю онлайн-курсы для Coursera и Stepik.
Преподавание держит знания в тонусе: чтобы объяснить тему другим, нужно самой глубоко в ней разобраться. А бизнес дает реальные данные, живые кейсы. Это идеальный обмен: наука помогает обновлять и систематизировать знания, индустрия проверяет их на прочность.
Если долго ограничиваться бизнес-задачами, взгляд неизбежно сужается, а в университетах видишь, чем живут молодые исследователи, читаешь свежие статьи, обсуждаешь идеи, которые еще не стали мейнстримом.
Разве в вопросах ИИ бизнес не ушел далеко вперед по сравнению с университетами?
Сейчас ИТ-компании, особенно большие, активно сотрудничают с вузами: не просто организовывают лекции, а открывают целые кафедры, создают научные лаборатории для студентов. Бизнес получает доступ к свежим идеям и талантам, вузы — к практическому опыту и ресурсам. В итоге университетские исследования нередко ложатся в основу реальных продуктов.
А может ли у нас в стране появиться аналог OpenAI — частный ИИ-стартап, способный потеснить крупных игроков?
Если честно, шансов почти нет. Чтобы тренировать современные большие модели и тем более делать что-то еще более прорывное, нужны колоссальные вычислительные ресурсы. Даже при наличии венчурных инвестиций (а с ними сейчас и так все сложно) стартапу крайне трудно конкурировать с инфраструктурой техногигантов, уже занявших эту нишу.
Плюс импортные ограничения. Стабильно и вовремя завезти серверное «железо» сейчас большая проблема. А без него просто не получится выйти на тот масштаб, который нужен для работы с огромными ИИ-моделями.
Да, собрать талантливую команду и сделать прототип реально. Но выйти на российский рынок со своей, натренированной с нуля языковой моделью и построить на ее основе бизнес почти невозможно. В лучшем случае кто‑то сможет зарегистрироваться за рубежом и оттуда обслуживать русскоязычных клиентов.
Но у нас есть перспективные частные проекты по локализации, вроде «Вихря» и Saiga: небольшие команды без больших бюджетов дорабатывают зарубежные открытые модели, дообучают их русскому языку.

«Нас ждет кардинально новый пользовательский опыт»
Какие тренды в ИИ считаешь самыми важными в этом году?
Первый — мультимодальность. Чтобы нейросети понимали не только текст, но и картинку, видео, звук и даже движения, например танец. И не только понимали, но и умели создавать. Тут все быстро развивается: то, что пару лет назад выглядело как абстрактный сюрреализм, теперь весьма реалистичные изображения и видео. В это направление сейчас активно вкладывают и деньги, и мозги.
Второй тренд — ИИ-агенты. Это цифровые помощники, способные взаимодействовать с внешним миром и находить там информацию. Google на своей конференции в этом году показал целую экосистему таких агентов. Один из них, Deep Research, умеет, например, самостоятельно решать многошаговые исследовательские задачи: пишет научные отчеты, делает обзоры литературы и даже доказывает простые теоремы.
Еще тренд — узкая специализация ИИ-сервисов. Универсальные модели по‑прежнему важны, но в индустрии все больше ценятся инструменты, заточенные под конкретные, очень специфические задачи: не модель, которая генерирует текст, а модель, которая пишет продающие описания для карточек товаров. Ведь чем уже инструмент, тем лучше он работает в своем контексте. И бизнесу это, конечно, выгоднее.
Что сейчас делается, чтобы эти возможности дошли до большинства пользователей?
Тут тоже три решающих направления. Первое — это демократизация доступа. Раньше, чтобы работать с нейросетями, нужно было быть инженером, писать код и собирать модели вручную. Сейчас уже есть простые интерфейсы, с которыми могут справиться, скажем, маркетологи или сотрудники банка. Но точно еще есть куда развиваться.
Вторая важная история — интерпретируемость. Все пытаются понять, почему ИИ принимает то или иное решение. Это уже не просто про точность, а про доверие. Один из исследователей из OpenAI недавно даже запустил курс по тому, как заглянуть внутрь модели и разобраться, как именно она «думает». Такой подход особенно важен в чувствительных сферах — например, в медицине или финансах, где хочется быть уверенным, что ИИ не играет в угадайку.
Ну и третье — бум MLOps: комплексного подхода, который объединяет разработку и развертывание моделей. С ним проще довести идею до реального продукта — по сути, это продюсирование в мире ИИ. Сейчас этому уделяют много внимания, иначе даже самая крутая нейросеть может так и остаться где-то в лаборатории.
Что насчет e-commerce? Как изменились и изменятся благодаря ИИ те же маркетплейсы с точки зрения покупателя?
Маркетплейсы из витрин эволюционируют в персональных шопинг-ассистентов. Уже сейчас рекомендательные алгоритмы подсказывают, что купить, помогают сравнивать товары, сортируют отзывы, подбирают рекламу под вкусы каждого.
Через несколько лет один и тот же маркетплейс будет выглядеть по-разному для разных пользователей. По сути, скоро у каждого будет «свой» магазин — со своей витриной, с индивидуальным набором товаров и акций, собранных под конкретные потребности и привычки.
А если представить, как изменится Wildberries?
Уверена, нас ждет кардинально новый пользовательский опыт. Все станет быстрее, проще и при этом куда более персонализированным. Появятся ИИ-ассистенты, которые сопроводят на всех этапах: от первой мысли «А не купить ли...» до рекомендации подписаться на регулярную доставку.

Над чем сейчас работает твоя команда, чтобы приблизить это?
У нас в департаменте сразу несколько направлений — и продуктовых, и исследовательских. Мы разрабатываем большие языковые и поведенческие модели, которые лежат в основе рекомендательных систем, поисковых алгоритмов, ИИ-ассистентов, автопереводов и голосового помощника.
В приоритете, как уже сказала, умные ассистенты. В первую очередь стараемся, чтобы они искали не просто по ключевым словам, а по смыслу: умели вытаскивать из описаний товаров конкретные характеристики — бренд, материал, размер — и подбирать то, что действительно хочет пользователь.
С рекомендательными системами тоже много экспериментируем: пробуем разные архитектуры нейросетей и учим модели искать связи между товарами и интересами пользователей.
Активно развиваем и автопереводы, чтобы карточки товаров выглядели естественно для покупателей в других странах — это важная задача для выхода на международные рынки.
ИИ в Wildberries в первую очередь для покупателей или он помогает и внутри компании?
Внутри помогает автоматизировать рутину. Например, в поддержке: модели отвечают на типовые вопросы клиентов и подсказывают операторам, как лучше сформулировать ответ. Это экономит кучу времени.
Еще ИИ участвует в логистике — просчитывает маршруты доставки, решает, с какого склада отправить заказ быстрее и дешевле. А еще упрощает работу разработчикам и маркетологам — например, с той же локализацией контента.
Какие новые вызовы создает для онлайн-ретейла бум ИИ?
Один из главных — это волна сгенерированного контента. Уже сейчас нейросети могут создавать не только карточки товаров, но и отзывы, описания, видеообзоры. Естественно, этим будут пользоваться мошенники.
В ближайшие годы маркетплейсам придется научиться отличать подлинные отзывы от фейков, разработать сложные системы верификации и фильтрации контента. Над этим уже работают исследовательские команды.
«ИИ-индустрия меняется слишком быстро, чтобы надеяться на однажды вызубренные учебники»
Сэм Альтман предсказывает, что AGI** появится в рамках двух-пяти лет. Насколько это реалистично?
Два года, три или пять лет — не буду бросаться числами. Но абсолютно точно ИИ будет становиться все умнее, а доверие к нему — расти. За последние годы многие процессы уже в корне изменились. Вместо Google мы все чаще задаем вопросы ChatGPT или другим чат-ботам, голосовые помощники управляют техникой в доме. И это только начало.
Что тогда принципиально изменит AGI?
AGI отличается универсальностью и достаточной степенью самосознания. Сейчас ИИ чаще всего «точечный» или «обо всем и ни о чем». А общий ИИ должен одинаково хорошо справляться с любыми задачами: от выбора ресторана до управления бизнесом. Потом, такой ИИ способен самообучаться: видеть, где у него пробелы в навыках, и заполнять их — а значит, развитие будет идти намного быстрее.
Какие тут риски?
На мой взгляд, главный риск бесконтрольного развития ИИ — это полная потеря безопасности и приватности данных.
Другая проблема, о которой говорила в контексте e-commerce, но, вообще-то, это общий тренд — лавинообразный рост сгенерированного контента.
Это влияет и на качество информационной среды, и на восприятие реальности: становится все сложнее отличить, где человек, а где машина.
Как новшества скажутся и уже сказываются на рынке труда?
Сокращения уже были — и в России, и за рубежом. В ИТ, банках, телекоме, e-commerce все меньше нужды в операторах поддержки, контент-менеджерах, маркетинговых аналитиках. Но рынок труда не сужается — он перестраивается. На смену одним ролям приходят другие: промпт-инженеры, ИИ-дизайнеры, тренеры моделей, интеграторы ИИ в бизнес-процессы.
В новых профессиях есть переоцененные?
Те, что связаны с ручной работой в машинном обучении. Компании могут собирать целые команды, чтобы вручную перебирать параметры моделей, запускать однотипные эксперименты, писать отчеты для топ-менеджмента. Это дорого и неэффективно.
На мой взгляд, человек в этом процессе должен заниматься совсем другим — думать, как улучшить архитектуру, как по-умному оптимизировать, как интерпретировать результаты. А вот перебор, тестирование, отчетность — это идеально ложится на автоматизацию. Мы же не нанимаем людей, чтобы они крутили ручку генератора, когда есть электричество.
Что посоветуешь тем, кто только собирается поступать в вуз и мечтает о карьере в ИИ?
ИИ-индустрия меняется слишком быстро, чтобы надеяться на однажды вызубренные учебники и решенные задачи.
Ключевой навык будущего — это умение быстро учиться, адаптироваться, переключаться между навыками и подходами.
Это не значит, что хард скиллы не нужны. Современные школьники уже на старте многое умеют: пишут код, участвуют в хакатонах, обучают нейросети. Это классно. Но я бы все равно советовала не пропускать базу, особенно математику: линейная алгебра, статистика, теория оптимизации — это скелет, на который потом ложатся любые модели и алгоритмы. Без этого сложно расти.
Очень полезны олимпиады, интенсивы, стажировки, летние школы — не только ради знаний, но и чтобы почувствовать реальные задачи, познакомиться с людьми из индустрии, увидеть, куда идти дальше. Чем раньше начнете, тем лучше.
И конечно, если у вас есть возможность учиться или стажироваться в ведущем вузе за рубежом, берите эту возможность. Погружение в международную среду — это не только про знания и технологии. Это про умение мыслить шире и предвосхищать тренды. Именно это сегодня и отличает сильного специалиста от просто хорошего.
* Признана экстремистской и запрещена в России.
** AGI (Artificial General Intelligence) — «общий» искусственный интеллект», ИИ с когнитивными способностями человеческого уровня, способный решать широкий спектр задач.