Искусство обучения: чем занимаются AI-тренеры? Рассказывает проджект-менеджер редакции YandexGPT
Настя Качулина объяснила, кто такие AI-тренеры и как они обучают нейросети.
Настя Качулина объяснила, кто такие AI-тренеры и как они обучают нейросети.
Нейросети всё плотнее входят в нашу жизнь: они генерируют тексты, рисуют картины, делают переводы с одного языка на другой, монтируют видео. Кто-то воспринимает новые технологии как угрозу, кто-то начинает изучать их для упрощения своей жизни.
Настя начинала путь в Яндексе как шеф-редактор AI-тренеров, а теперь курирует процессы в команде и помогает другим шеф-редакторам. За её плечами большой опыт в журналистике: работа в новостном агентстве, в издании «Мел», руководство журналом Skyeng Magazine. Раньше Настя скептически относилась к нейросетям, а теперь обучает их вместе с коллегами. Она рассказала, в чём заключается роль AI-тренера и кто подходит для этой профессии.
YandexGPT — генеративная языковая модель Яндекса. Она умеет генерировать тексты, отвечать на вопросы, кратко пересказывать статьи, создавать карточки товаров для маркетплейсов, сравнивать отзывы, писать простой код, делать текстовые описания к генеративным изображениям в Шедевруме. YandexGPT доступна в приложениях Яндекс и Яндекс Старт, в Яндекс Браузере, Яндекс Станциях, в умных телевизорах с Алисой, а теперь и в Алисе нового поколения. Также она работает в более чем 10 сервисах Яндекса: Поиске, Лавке, Практикуме и других. С апреля 2024 года YandexGPT есть и в Почте: на базе неё работает Нейрофильтр, который выделяет и суммаризует важные письма.
Профессия AI-тренер появилась в России в конце 2022 года: Яндекс одним из первых стал набирать специалистов на такую позицию. Если коротко, то AI-тренеры обучают нейросети: создают качественные примеры для подражания и помогают определить, какой результат хороший, а какой плохой.
Сначала это вызвало во мне спорные чувства: как будто у нас, у пишущих людей, отбирают хлеб. Хотя на самом деле появление нейросетей — это очередной этап научного прогресса. Когда-то люди пересели с лошадиных повозок на автомобили, а сейчас развивают искусственный интеллект, чтобы делегировать ему рутинные задачи.
Чтобы лучше понять роль AI-тренеров, нужно знать, как строится процесс обучения. Он проходит в четыре этапа:
Например, нейросеть видит предложение: «Шёл дождь, а я пошёл на работу и взял с собой...». Дальше у неё возникают варианты, как его продолжить: зонт, портфель, собаку.
Как видите, команда AI-тренеров участвует во втором и третьем этапе. Мы закладываем базу знаний, которые пригодятся нейросети в работе с пользователями. Чем качественнее будет обучение модели, тем корректнее она сможет отвечать на вопросы и решать поставленные задачи.
AI-тренер — новая профессия на российском рынке. Но к таким специалистам уже есть чёткий список требований:
Если AI-тренер обучает генеративную модель для Яндекс Поиска, он пишет ответы по результатам поисковой выдачи. Не все страницы из выдачи правдивы: там есть фейковая информация, и тренер должен уметь такое отсеивать.
Мы работаем с молодым продуктом: он быстро развивается, поэтому команда тоже постоянно растёт. У нас уже сотни тренеров искусственного интеллекта и шеф-редакторов. Чтобы попасть в редакцию YandexGPT, каждый специалист проходит три этапа отбора:
В тестовых заданиях проверяют, дружит ли кандидат с этикой, русским языком, фактчекингом и ранжированием. Лично я в процессе выполнения тестового впервые осознала, насколько большая ответственность с этической точки зрения лежит на тех, кто работает с нейросетями. Например, если человек спрашивает, как вылечиться от пневмонии, мы должны не приводить различные способы, а прежде всего отправить человека ко врачу.
Люди могут задать искусственному интеллекту любой вопрос. Чтобы обучить модель реагировать максимально корректно, AI-тренер должен уделять огромное внимание этичности и безопасности при написании текстов.
AI-тренер в Яндексе начинает свой день с того, что открывает рабочее пространство с доступными заданиями. Каждый шеф-редактор передаёт своей команде AI-тренеров приоритеты: какую задачу сегодня нужно сделать в первую очередь, какую — в последнюю. Приоритеты определяются совместно с аналитиками данных.
В один день тренеру могут попасться разные темы: от «как растёт трава» до устройства ядерного реактора. Разделения по областям знаний среди AI-тренеров нет: если специалист понимает, что какая-то тема для него слишком сложная, он может поменяться с коллегой или попросить экспертной помощи.
Также все задания можно разбить по типам. Основных — три.
Создание идеального текста по инструкциям | Разметки | Ранжирование |
---|---|---|
Нужно написать образцовый текст для нейросети. Она потом проанализирует его и попробует повторить паттерны, которые человек проявляет, когда пишет идеальный ответ на вопрос. | Нужно проанализировать текст, который написала нейросеть, и выделить ошибки — например, в корректности фактов или правописании. | Нужно распределить несколько вариантов ответа от нейросети в порядке «от лучшего к худшему», чтобы модель постепенно усвоила критерии удачных ответов и сама стала показывать пользователю именно их. |
Создание идеального текста по инструкциям | Нужно написать образцовый текст для нейросети. Она потом проанализирует его и попробует повторить паттерны, которые человек проявляет, когда пишет идеальный ответ на вопрос. |
---|---|
Разметки | Нужно проанализировать текст, который написала нейросеть, и выделить ошибки — например, в корректности фактов или правописании. |
Ранжирование | Нужно распределить несколько вариантов ответа от нейросети в порядке «от лучшего к худшему», чтобы модель постепенно усвоила критерии удачных ответов и сама стала показывать пользователю именно их. |
Погрузиться в тонкости каждого типа задач бывает тяжело. В зависимости от того, что у AI-тренера получается лучше — писать, размечать или ранжировать, — он начинает специализироваться на определенной группе заданий. Но это не значит, что специалист будет работать только с ней: чтобы на время переключить внимание и избежать рутины, можно взяться за задачу другого характера.
Чтобы глобально оценить, насколько успешно идёт работа по обучению нейросетей, аналитики проводят замеры по разным показателям: владение русским языком, обращение со сложными фактами, поддержание контекста беседы и другим. Например, качество ответов YandexGPT 3 улучшилось на 10% в сравнении с YandexGPT 2, а число ошибок cократилось с 16,4% до 13,5%.
Для оценки эффективности AI-тренеров как профессионалов в Яндексе выстроена отдельная система. Она состоит из следующих критериев:
Если AI-тренер хорошо справляется с задачами, то у него есть перспективы для роста. Он начинает плотнее взаимодействовать с аналитиками, участвовать в разработке и запуске новых заданий для нейросети, в написании инструкций к ним. Также в редакции YandexGPT есть примеры, когда специалисты за несколько месяцев вырастали из тренеров в шеф-редакторов, набирали свои команды и начинали руководить ими.
AI-тренеры обучают нейросети, чтобы потом они помогали обычным людям и бизнесу решать их задачи. Каждый текст, который пишут специалисты для искусственного интеллекта, — это вклад в то, чем будут пользоваться миллионы людей.
Ответы, которые пишет AI-тренер, используются для обучения модели, а не для того, чтобы модель выдавала эти ответы на запросы пользователей. То есть конкретно эти тексты не видны публике. С другой стороны, такая работа влияет на качество сотен, тысяч и даже миллионов следующих ответов — от этого захватывает дух.
Нейросети, конечно, будут совершенствоваться, ошибок в их ответах будет всё меньше. Это повлияет и на нашу повседневную жизнь, и на бизнес, и на рынок труда. Но искусственный интеллект не заменит аналитическое мышление человека: думающие, креативные, эмпатичные специалисты, в том числе AI-тренеры, будут нужны всегда. Бояться нейросетей не стоит — нужно «растить» их как своих помощников.