чтение данных из файла .csv - PullRequest
0 голосов
/ 29 апреля 2019

Итак, у меня есть набор данных для проблемы НЛП, который содержит данные в следующем формате: код, тело, результат

2552272216, мед превращает черные волосы в белые?, [Седые волосы]

2552210209, "Здравствуйте, доктор, моей маме был поставлен диагноз депрессии в возрасте 36 лет из-за чрезмерного обдумывания семейных проблем. Это вызвало ее депрессию, вызвавшую ряд других психических проблем, и ухудшило ее состояние, что привело к мозговому инсульту и она ушла. Теперь мой вопрос может случиться со мной или с моей сестрой также в какой-то момент. ", [Депрессия]

используя pd.read_csv, я читал эти строки, используя ',' в качестве разделителя, но я хочу, чтобы последний столбец читался как список, а не как строка. Пожалуйста, помогите!

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import json
# Importing the dataset
dataset = pd.read_csv('case_study_lybrate.csv', delimiter=',',
                     quoting=1, skipinitialspace=True)

1 Ответ

0 голосов
/ 29 апреля 2019

Из документации Pandas видно, что вам нужно установить параметр data.

dtype: введите имя или диктат столбца -> тип, необязательный тип данных для данных или столбцов.Например, {'a': np.float64, 'b': np.int32, 'c': 'Int64'} Используйте str или object вместе с подходящими настройками na_values, чтобы сохранить и не интерпретировать dtype.Если указаны конвертеры, они будут применены ВМЕСТО преобразования dtype.

Например:

dataset = pd.read_csv('case_study_lybrate.csv', delimiter=',',
                     quoting=1, skipinitialspace=True,
                     dtype={'code': str, 'body': str, 'result': list()}) 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...