Антон Кленицкий: Кластеризация коротких текстов

Опубликовано: 30 Сентябрь 2024
на канале: ML Trainings
2,879
119

Data Fest Online 2021
NLP in Industry track https://ods.ai/tracks/nlp-df2021

Как сделать кластеризацию коротких текстов, состоящих из одного или нескольких предложений? Конечно, совсем несложно запустить на данных какой-нибудь стандартный алгоритм кластеризации. Но результат может разочаровать. Чтобы получить однородные и осмысленные в кластера, в которых все фразы действительно похожи, придется немного постараться. Нужно решить, в каком виде лучше подготовить данные на вход и выбрать подходящий алгоритм кластеризации. А затем понять, как проанализировать полученные результаты.

Посмотреть эфир и список треков и организаторов: https://datafest.ru/2021/
Зарегистрироваться на фест и получить доступ к трекам: https://ods.ai/events/datafest2021
Вступить в сообщество: https://ods.ai/

Соцсети Data Fest:
https://t.me/datafest
https://vk.com/datafest