#статический_анализ #алгоритм #методы
С помощью каких алгоритмов/способов можно отличить текст про кулинарию например от текста про программирование?
Ответы
Ответ 1
Простейший метод - анализ частоты слов в соответствии с тематическими словарями.Ответ 2
Латентно-семантический анализ (LSA)Ответ 3
Самый простой, классический способ - Байесовы классификаторы. Их, например, используют в спам фильтрах. (понятно, что сейчас уже далеко не только их) Есть очень мощная и функциональная библиотека для классификации текстов - DKPro TC.
Комментариев нет:
Отправить комментарий