Страницы

Поиск по вопросам

суббота, 21 декабря 2019 г.

Как найти ключевые слова в тексте одного столбца DataFrame?

#python #регулярные_выражения #pandas #dataframe #csv


у меня есть файл CSV я его прочитал, импортировал библиотеки
мне необходимо найти ключевые слова в тексте одного столбца: 

вот эти критерии, отдельно:

/city/directory/<цифры или буквы>.html

/good/<цифры>/owner_info

/bulletin/<цифры> 


и пользователь у которого совпадали эти 3 критерии совместно

мой код

import pandas as pd
import numpy as np
import re

exp = pd.read_csv(r'C:\Users\4X\Desktop\pandas\study\...csv')

re.findall('(?:/good/)|(?:/owner_info)', '/good/<цифры>/owner_info?')
exp.query('url == @card_filte')


здесь все отрабатывает

а вот со вторым и третьим не работает

contacs1 = re.findall(r'(?:/good/)|(?:/owner_info)', '/good/<цифры>/owner_info?')
exp.query('url == @contacs1_filte')

contacs2 = re.findall(r'(?:/bulletin/)', '/bulletin/<цифры>')
exp.query('url == @contacs1_filte')

    


Ответы

Ответ 1



Для того чтобы искать в столбце используя регулярные выражения можно воспользоваться pandas.Series.str.contains(): mask = df["column_name"].str.contains(r"") res = df.loc[mask] PS если в вопросе будет приведен пример данных и ожидаемый результат, то я дополню вопрос примером, с использованием ваших данных...

Комментариев нет:

Отправить комментарий