Применили одну и ту же функцию к двум очень похожим наборам данных, но получили два разных результата - PullRequest
0 голосов
/ 16 марта 2020

Это задание AI из курса, мне нужно читать данные из текстовых файлов, один - данные поезда, другой - данные теста. Эти два набора данных имеют почти одинаковую структуру данных. И я написал функцию для обработки данных. Во-первых, читать из текстового файла построчно. Затем я проделал некоторую работу по очистке данных в столбце 16. Наконец, я вернул транспонирование данных. Я применил эту функцию в данных обучения и испытаний. Но оказывается, что функция отлично работает на данных испытаний, а не на данных поездов. (Данные поездов не были транспонированы) Я не знаю почему.

Как видно на этом рисунке, функция.

import numpy as np
class Task1:
    def __init__(self):
        print("================Task 1================")
        train_data0 = "assign3_students_train.txt"
        test_data0 = "assign3_students_test.txt"

        train_data = self.process_data(train_data0)
        test_data = self.process_data(test_data0)

        print(train_data[0])
        print(test_data[0])
        return

    def process_data(self, data):
        with open(data, 'r') as file:
            myfile = [line.split() for line in file]
        for i in range(0, len(myfile)):
            if myfile[i][16] != "no" and myfile[i][16] != "yes":
                myfile[i][15] = myfile[i][15] + myfile[i][16]
                del myfile[i][16]
        return np.transpose(myfile)

Результаты: Первый - это данные поезда, ниже - данные испытаний. .

Кроме того, формат данных поезда и испытаний: данные поезда данные испытаний

...