У многих страниц при парсинге, отсутствует тег description. Здесь написано, что при отсутствии, тега description поисковые системы берут отдельный отрывок. Не до конца понятно, по-какому принципу отбирается аннотация к сайту. К примеру, если выбирать самый первый встречающийся тег
может попасться не то описание. У википедии нет тега description, хотя Google в таком случае выдает по запросу python правильный абзац. Можно ли это как-то сделать при помощи парсера или регулярок ?
Ответ
Думаю вы не дочитали описание meta-тега description: При отсутствии тега поисковые системы выдают в аннотации первую строку документа или отрывок, содержащий ключевые слова. То есть поисковик берет первый отрывок содержащий ключевое слово заданное в поиске
Комментариев нет:
Отправить комментарий