Страницы

Поиск по вопросам

среда, 11 декабря 2019 г.

Существует ли массив… матов?

#база_данных


Пишу авторизацию в приложении и хочется отсечь попытки неадекватных школьников уже
на этом этапе вписать в EditText невалидное имя (маты).

Проверку хотел сделать через .contains ArrayList, дак вот после наверное
двадцатого элемента фантазия кончилась :) да и не совсем по душе пришлось занятие :)

Поэтому вопрос - может кто уже делал подобную БД и может поделиться (на полный список
не рассчитываю по понятным причинам), чтобы просто Ctrl+C, Ctrl+V.

PS. Просьба отнестись с пониманием и не пинать больно - с подобной задачей столкнулся
впервые.
    


Ответы

Ответ 1



Тема стара как мир. Из того, что я видел, именно php-censure - скрипт на PHP для определения нецензурных слов - оказался лучше других по отзывам. Можете взять на вооружение подход, который в нём используется: "плохие" слова определяются по частям. Отдельно приставка, отдельно корень и тд. Именно потому, что матерных слов существует не много, а много - производных от них, такой подход работает хорошо. Также используется список "хороших" слов, чтобы не зацензурировать лишнего. А вот на форуме Vingrad выложили архив из ~200 матерных выражений (нужна учётная запись на сайте для скачивания). Список, используемый в zlo-search. Список нецензурных слов и производных. Список нецензурных слов для анти-спама и цензуры.

Комментариев нет:

Отправить комментарий