#python #регулярные_выражения #pandas #dataframe #csv
у меня есть файл CSV я его прочитал, импортировал библиотеки
мне необходимо найти ключевые слова в тексте одного столбца:
вот эти критерии, отдельно:
/city/directory/<цифры или буквы>.html
/good/<цифры>/owner_info
/bulletin/<цифры>
и пользователь у которого совпадали эти 3 критерии совместно
мой код
import pandas as pd
import numpy as np
import re
exp = pd.read_csv(r'C:\Users\4X\Desktop\pandas\study\...csv')
re.findall('(?:/good/)|(?:/owner_info)', '/good/<цифры>/owner_info?')
exp.query('url == @card_filte')
здесь все отрабатывает
а вот со вторым и третьим не работает
contacs1 = re.findall(r'(?:/good/)|(?:/owner_info)', '/good/<цифры>/owner_info?')
exp.query('url == @contacs1_filte')
contacs2 = re.findall(r'(?:/bulletin/)', '/bulletin/<цифры>')
exp.query('url == @contacs1_filte')
Ответы
Ответ 1
Для того чтобы искать в столбце используя регулярные выражения можно воспользоваться pandas.Series.str.contains(): mask = df["column_name"].str.contains(r"") res = df.loc[mask] PS если в вопросе будет приведен пример данных и ожидаемый результат, то я дополню вопрос примером, с использованием ваших данных...
Комментариев нет:
Отправить комментарий