Извлечение числового значения из файлов .csv - PullRequest
1 голос
/ 29 сентября 2019

У меня есть датафрейм с колонкой путей.Я могу получить доступ к этим путям, используя:

for i, p in enumerate(df['path']):

Однако сейчас я пытаюсь извлечь значение из каждого из этих выходных файлов.

CSV-файл выглядит следующим образом:

# some values 
# some values : some values
# some values : some values
# some values : some values
# some string : the value I want
# some string : some values

Есть ли способ извлечь это значение и вставить его в мой фрейм данных?

Я полагаю, что регулярное выражение сработает.Я просто не уверен в точном пути.У меня есть шаблон кода, который выглядит так:

if re.match(r"something", p):
        df = pd.read_csv(p)
        df.iloc[i, value_column] = the value I want

1 Ответ

0 голосов
/ 29 сентября 2019

Вот решение для извлечения значения из текста / CSV с использованием встроенного split:

def get_value(string):
    array = string.split(": ")  # maybe without the white space
    return array[0] if len(array) == 1 else array[1]

get_value('some values')
# 'some values'
get_value('some string : the value I want')
# 'the value I want'

В качестве альтернативы, используя регулярное выражение

re.sub(r'.*\:\s*(.*)', r'\1', 'some values')
# 'some values'
re.sub(r'.*\:\s*(.*)', r'\1', 'some string : the value I want')
# 'the value I want'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...