Передача данных в функцию в Python - PullRequest
0 голосов
/ 24 июня 2019

Я написал function в Python, но я передаю string в function как parameter, но у меня есть файл Excel, который является Dataframe, в котором теперь много строк, и я хочу обработать каждыйстрока столбца как string. Как мне это сделать?

Я написал следующий function, который принимает строку в качестве входных данных, не желая передавать фрейм данных в function, какя делаю это?

def pre_process(utterance):
    utterance = remove_name(utterance)
    utterance = text_in_next_line_after_dot(utterance)
    utterance = convert_num_to_words(utterance)
    utterance = remove_stop_phrase(utterance)
    utterance = remove_character(utterance)
    utterance = remove_blank_lines(utterance)
return utterance.strip()

Датафрейм выглядит так

id         Utterance
1    my name is cyley . I am at post91
2    after 24 hours you need to send the email
3    there interaction id is 123456
4   he is studying at masters school

У меня есть такой тип данных.Я хочу использовать в качестве строки в вышеприведенной функции столбец высказывания

1 Ответ

0 голосов
/ 24 июня 2019

Смотрите макет. в основном вы обновляете столбец данных с помощью логики в функции (remove_numbers: это удаляет все числа из столбца высказываний). Дайте мне знать, если это работает.

import pandas as pd
import re

df = pd.DataFrame({'id': [1,2,3,4],
                  'Utterance': [
                      'my name is cyley . I am at post91', 
                      'after 24 hours you need to send the email', 
                      ' there interaction id is 123456', 
                      'he is studying at masters school']})
def remove_numbers(s):
    return re.sub(r'\d+', '', s)



def pre_process():
    df['Utterance'] = df['Utterance'].apply(remove_numbers)
    #utterance = text_in_next_line_after_dot(utterance)
    #utterance = convert_num_to_words(utterance)
    #utterance = remove_stop_phrase(utterance)
    #utterance = remove_character(utterance)
    #utterance = remove_blank_lines(utterance)
    return None

pre_process()

df

результат ниже:

Utterance   id
0   my name is cyley . I am at post 1
1   after hours you need to send the email  2
2   there interaction id is 3
3   he is studying at masters school    4
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...