Страницы

Поиск по вопросам

вторник, 24 декабря 2019 г.

Какие существуют методы анализа текста на принадлежность к определенной тематике?

#статический_анализ #алгоритм #методы


С помощью каких алгоритмов/способов можно отличить текст про кулинарию например от
текста про программирование?    


Ответы

Ответ 1



Простейший метод - анализ частоты слов в соответствии с тематическими словарями.

Ответ 2



Латентно-семантический анализ (LSA)

Ответ 3



Самый простой, классический способ - Байесовы классификаторы. Их, например, используют в спам фильтрах. (понятно, что сейчас уже далеко не только их) Есть очень мощная и функциональная библиотека для классификации текстов - DKPro TC.

Комментариев нет:

Отправить комментарий