Искусство обучения: чем занимаются AI-тренеры? Рассказывает проджект-менеджер редакции YandexGPT

Настя Качулина объяснила, кто такие AI-тренеры и как они обучают нейросети.

23.04.2024(обновлено 26.04.2024)
Искусство обучения: чем занимаются AI-тренеры? Рассказывает проджект-менеджер редакции YandexGPT

Нейросети всё плотнее входят в нашу жизнь: они генерируют тексты, рисуют картины, делают переводы с одного языка на другой, монтируют видео. Кто-то воспринимает новые технологии как угрозу, кто-то начинает изучать их для упрощения своей жизни.

Настя начинала путь в Яндексе как шеф-редактор AI-тренеров, а теперь курирует процессы в команде и помогает другим шеф-редакторам. За её плечами большой опыт в журналистике: работа в новостном агентстве, в издании «Мел», руководство журналом Skyeng Magazine. Раньше Настя скептически относилась к нейросетям, а теперь обучает их вместе с коллегами. Она рассказала, в чём заключается роль AI-тренера и кто подходит для этой профессии.

YandexGPT — генеративная языковая модель Яндекса. Она умеет генерировать тексты, отвечать на вопросы, кратко пересказывать статьи, создавать карточки товаров для маркетплейсов, сравнивать отзывы, писать простой код, делать текстовые описания к генеративным изображениям в Шедевруме. YandexGPT доступна в приложениях Яндекс и Яндекс Старт, в Яндекс Браузере, Яндекс Станциях, в умных телевизорах с Алисой, а теперь и в Алисе нового поколения. Также она работает в более чем 10 сервисах Яндекса: Поиске, Лавке, Практикуме и других. С апреля 2024 года YandexGPT есть и в Почте: на базе неё работает Нейрофильтр, который выделяет и суммаризует важные письма.

Кто такие AI-тренеры и что они делают

Профессия AI-тренер появилась в России в конце 2022 года: Яндекс одним из первых стал набирать специалистов на такую позицию. Если коротко, то AI-тренеры обучают нейросети: создают качественные примеры для подражания и помогают определить, какой результат хороший, а какой плохой.

Сначала это вызвало во мне спорные чувства: как будто у нас, у пишущих людей, отбирают хлеб. Хотя на самом деле появление нейросетей — это очередной этап научного прогресса. Когда-то люди пересели с лошадиных повозок на автомобили, а сейчас развивают искусственный интеллект, чтобы делегировать ему рутинные задачи.

Чтобы лучше понять роль AI-тренеров, нужно знать, как строится процесс обучения. Он проходит в четыре этапа:

  • Первый этап: модель тренируется на большом количестве текстовых данных из интернета. Нейросеть запоминает слова, смысловые, грамматические и другие связи между ними и таким образом получает информацию о мире. Так она учится предсказывать следующее слово в предложении.

Например, нейросеть видит предложение: «Шёл дождь, а я пошёл на работу и взял с собой...». Дальше у неё возникают варианты, как его продолжить: зонт, портфель, собаку.

  • Второй этап: модель получает не просто массив разных текстов, а данные вида «запрос — ответ». Для этого этапа AI-тренеры создают как можно больше идеальных текстов под каждый запрос. Главная задача — показать нейросети, как люди пишут ответы, чтобы она смогла самостоятельно решать похожие задачи.
  • Третий этап: модель учится оценивать ответы. Она выбирает, какой лучше, а какой хуже. Здесь AI-тренеры должны показать модели несколько отранжированных ответов на один запрос. То есть мы вкладываем в модель критерии хорошего ответа.
  • Четвёртый этап: модель совершенствуется сама. Она уже понимает, какие параметры дают наилучший результат, использует эти сигналы и на их основе самообучается.

Как видите, команда AI-тренеров участвует во втором и третьем этапе. Мы закладываем базу знаний, которые пригодятся нейросети в работе с пользователями. Чем качественнее будет обучение модели, тем корректнее она сможет отвечать на вопросы и решать поставленные задачи.

Что нужно знать и уметь тем, кто обучает нейросети

AI-тренер — новая профессия на российском рынке. Но к таким специалистам уже есть чёткий список требований:

  • Быть грамотным. AI-тренеры в Яндексе работают без корректоров, поэтому важно самому не допускать ошибок или уметь пользоваться сервисами для проверки текстов.
  • Быстро разбираться в большом количестве информации. Зачастую приходится работать сразу с несколькими источниками, из которых важно выделить главное. Кроме того, у тренеров много инструкций и они постоянно обновляются — нужно держать руку на пульсе.
  • Владеть навыком фактчекинга. Нужно аккуратно обращаться с фактами, уметь отличать хорошие сайты от плохих и писать ответ даже по неидеально качественному источнику.
Если AI-тренер обучает генеративную модель для Яндекс Поиска, он пишет ответы по результатам поисковой выдачи. Не все страницы из выдачи правдивы: там есть фейковая информация, и тренер должен уметь такое отсеивать.
  • Быть готовым к неопределённости. Бывает, что AI-тренер месяц работает над одним типом задания, а потом оказывается, что гипотеза не подтвердилась. Тогда приходится переключаться на другую задачу, используя полученный опыт.
  • Уметь сосредоточиться. У AI-тренеров достаточно рутинная работа. Надо понимать, что сегодня делаешь разные задачи, а завтра — одни и те же. Это требует большой концентрации внимания.

Мы работаем с молодым продуктом: он быстро развивается, поэтому команда тоже постоянно растёт. У нас уже сотни тренеров искусственного интеллекта и шеф-редакторов. Чтобы попасть в редакцию YandexGPT, каждый специалист проходит три этапа отбора:

Нейросети_Скриншот 1
Так выглядит путь тех, кто откликается на вакансию AI-тренера в Яндексе

В тестовых заданиях проверяют, дружит ли кандидат с этикой, русским языком, фактчекингом и ранжированием. Лично я в процессе выполнения тестового впервые осознала, насколько большая ответственность с этической точки зрения лежит на тех, кто работает с нейросетями. Например, если человек спрашивает, как вылечиться от пневмонии, мы должны не приводить различные способы, а прежде всего отправить человека ко врачу.

Люди могут задать искусственному интеллекту любой вопрос. Чтобы обучить модель реагировать максимально корректно, AI-тренер должен уделять огромное внимание этичности и безопасности при написании текстов.

С какими задачами работают AI-тренеры

AI-тренер в Яндексе начинает свой день с того, что открывает рабочее пространство с доступными заданиями. Каждый шеф-редактор передаёт своей команде AI-тренеров приоритеты: какую задачу сегодня нужно сделать в первую очередь, какую — в последнюю. Приоритеты определяются совместно с аналитиками данных.

В один день тренеру могут попасться разные темы: от «как растёт трава» до устройства ядерного реактора. Разделения по областям знаний среди AI-тренеров нет: если специалист понимает, что какая-то тема для него слишком сложная, он может поменяться с коллегой или попросить экспертной помощи.

Также все задания можно разбить по типам. Основных — три.

Типы заданий для AI-тренеров

Создание идеального текста по инструкциямРазметкиРанжирование
Нужно написать образцовый текст для нейросети. Она потом проанализирует его и попробует повторить паттерны, которые человек проявляет, когда пишет идеальный ответ на вопрос. Нужно проанализировать текст, который написала нейросеть, и выделить ошибки — например, в корректности фактов или правописании. Нужно распределить несколько вариантов ответа от нейросети в порядке «от лучшего к худшему», чтобы модель постепенно усвоила критерии удачных ответов и сама стала показывать пользователю именно их.
Создание идеального текста по инструкциямНужно написать образцовый текст для нейросети. Она потом проанализирует его и попробует повторить паттерны, которые человек проявляет, когда пишет идеальный ответ на вопрос. 
РазметкиНужно проанализировать текст, который написала нейросеть, и выделить ошибки — например, в корректности фактов или правописании.
РанжированиеНужно распределить несколько вариантов ответа от нейросети в порядке «от лучшего к худшему», чтобы модель постепенно усвоила критерии удачных ответов и сама стала показывать пользователю именно их.

Погрузиться в тонкости каждого типа задач бывает тяжело. В зависимости от того, что у AI-тренера получается лучше — писать, размечать или ранжировать, — он начинает специализироваться на определенной группе заданий. Но это не значит, что специалист будет работать только с ней: чтобы на время переключить внимание и избежать рутины, можно взяться за задачу другого характера.

Как оценивают эффективность работы AI-тренеров в Яндексе

Чтобы глобально оценить, насколько успешно идёт работа по обучению нейросетей, аналитики проводят замеры по разным показателям: владение русским языком, обращение со сложными фактами, поддержание контекста беседы и другим. Например, качество ответов YandexGPT 3 улучшилось на 10% в сравнении с YandexGPT 2, а число ошибок cократилось с 16,4% до 13,5%.

Для оценки эффективности AI-тренеров как профессионалов в Яндексе выстроена отдельная система. Она состоит из следующих критериев:

  • Производительность — с какой скоростью работает человек. Есть ожидаемое время выполнения каждого задания, оно основано на средних показателях команды.
  • Качество — насколько точно AI-тренер соблюдает инструкцию, выполняя задание. Качество всегда в приоритете: оно важнее скорости работы.

Если AI-тренер хорошо справляется с задачами, то у него есть перспективы для роста. Он начинает плотнее взаимодействовать с аналитиками, участвовать в разработке и запуске новых заданий для нейросети, в написании инструкций к ним. Также в редакции YandexGPT есть примеры, когда специалисты за несколько месяцев вырастали из тренеров в шеф-редакторов, набирали свои команды и начинали руководить ими.

Вклад AI-тренеров в развитие нейросетей

AI-тренеры обучают нейросети, чтобы потом они помогали обычным людям и бизнесу решать их задачи. Каждый текст, который пишут специалисты для искусственного интеллекта, — это вклад в то, чем будут пользоваться миллионы людей.

Ответы, которые пишет AI-тренер, используются для обучения модели, а не для того, чтобы модель выдавала эти ответы на запросы пользователей. То есть конкретно эти тексты не видны публике. С другой стороны, такая работа влияет на качество сотен, тысяч и даже миллионов следующих ответов — от этого захватывает дух.

Нейросети, конечно, будут совершенствоваться, ошибок в их ответах будет всё меньше. Это повлияет и на нашу повседневную жизнь, и на бизнес, и на рынок труда. Но искусственный интеллект не заменит аналитическое мышление человека: думающие, креативные, эмпатичные специалисты, в том числе AI-тренеры, будут нужны всегда. Бояться нейросетей не стоит — нужно «растить» их как своих помощников.

Поделиться

Яндекс 360

Рекомендуемые материалы