Анастасия Овчинникова - Сервис генерации саммари к вакансиям на основе LM,дообученной с помощью RLHF

Опубликовано: 29 Сентябрь 2024
на канале: ML Trainings
876
29

Зачем нужны саммари вакансий, как мы создавали их раньше и как хотим создавать в идеале.
Немного про генеративные модели. Что мы получили с помощью T5.
Предпосылки RLHF и как это может нам помочь. Основные компоненты RLHF: model, reward model, trainer.
Обучение reward model, генерация датасета с помощью t5 и человеческой разметки.
Обучение RLHF
Результаты A/B тестов и выкатка в prod

Data Fest 2023:
https://ods.ai/events/datafestonline2023
Трек "Instruct Models":
https://ods.ai/tracks/df23-instruct-m...

Наши соц.сети:
Telegram: https://t.me/datafest
Вконтакте: https://vk.com/datafest