Я хочу преобразовать файл .data
в файл .csv
, поэтому я читаю файл .data
, заменяя некоторые символы и строки, так что файл .csv
должен быть читаемым с numpy.loadtxt
. К сожалению, две строки:
line = line.replace("yes", "1")
line = line.replace("no", "0")
пропущены. Так что функция .loadtxt
не будет работать. Я пытался изменить символы замены, все безуспешно. Было бы хорошо, если бы кто-то мог мне помочь. Вот полный код:
import numpy as np
fString = open("diagnosis.data", "r")
fFloat = open("diagnosis.csv", "w")
for line in fString:
line = line.replace(",", ".")
line = line.replace("\t", ",")
line = line.replace("yes", ",1")
line = line.replace("no", "0")
line = line.replace("\r\n", "\n")
fFloat.write(line)
fString.close()
fFloat.close()
fFloat = open("diagnosis.csv","r")
dataset = np.loadtxt(fFloat, delimiter=",")
fFloat.close()
Набор данных можно найти здесь