Страницы

Поиск по вопросам

суббота, 11 апреля 2020 г.

Адресация по объектам BeautifulSoup

#python #beautiful_soup

                    
Пищу парсер на Python 2.7, используя BeautifulSoup 4. Возникла трудность.

Извлек я все элементы  со страницы.

for p in allPosts:
    postIMG = p.find_all('img')


В итоге получилось:

Название
Название 2



Как обратится к тексту? Можно как-то через точку? postIMG.alt ? Или как лучше?
Как красивее всего извлечь урл картинки?

    


Ответы

Ответ 1



find_all возвращает список объектов класса bs4.element.Tag и к аттрибутам элемента можно обратиться через словарь attrs: for p in allPosts: postIMG = p.find_all('img') print postIMG[0].attrs['alt'] print postIMG[0].attrs['src'] Если картинка в посте одна, то удобнее использовать метод find, вместо find_all: for p in allPosts: postIMG = p.find('img') print postIMG.attrs['alt'] print postIMG.attrs['src']

Комментариев нет:

Отправить комментарий