#база_данных
Пишу авторизацию в приложении и хочется отсечь попытки неадекватных школьников уже на этом этапе вписать в EditText невалидное имя (маты). Проверку хотел сделать через .contains ArrayList, дак вот после наверное двадцатого элемента фантазия кончилась :) да и не совсем по душе пришлось занятие :) Поэтому вопрос - может кто уже делал подобную БД и может поделиться (на полный список не рассчитываю по понятным причинам), чтобы просто Ctrl+C, Ctrl+V. PS. Просьба отнестись с пониманием и не пинать больно - с подобной задачей столкнулся впервые.
Ответы
Ответ 1
Тема стара как мир. Из того, что я видел, именно php-censure - скрипт на PHP для определения нецензурных слов - оказался лучше других по отзывам. Можете взять на вооружение подход, который в нём используется: "плохие" слова определяются по частям. Отдельно приставка, отдельно корень и тд. Именно потому, что матерных слов существует не много, а много - производных от них, такой подход работает хорошо. Также используется список "хороших" слов, чтобы не зацензурировать лишнего. А вот на форуме Vingrad выложили архив из ~200 матерных выражений (нужна учётная запись на сайте для скачивания). Список, используемый в zlo-search. Список нецензурных слов и производных. Список нецензурных слов для анти-спама и цензуры.
Комментариев нет:
Отправить комментарий