Небольшая помощь по моему проекту Capstone - Преобразование набора данных из ASCII в то, что Python может прочитать - PullRequest
0 голосов
/ 09 октября 2018

Спасибо за чтение моего поста.Я застрял ... Я использую Национальный стационарный образец (NIS) 2016, который представляет собой набор данных из семи миллионов больничных записей.Мне нужно изолировать матерей, которые родили, и их новорожденных, что составляет 850,00 записей.

Набор данных в формате ASCII , который необходимо преобразовать в формат, который я могуиспользовать в Python.Оттуда мне нужно использовать коды ICM-10 для всех случаев родов, для матери и ее ребенка (детей), чтобы создать новый набор данных, который я использую для анализа данных.

Итак, мои шаги следующие:

1 - преобразовать ASCII во что-то, что Python может использовать, и убедитесь, что программа правильно считывает данные в соответствии с числовыми или строковыми значениями.Я не могу сделать эту работу;Кто-нибудь может мне помочь с кодом?

import numpy as np

import matplotlib.pyplot as plt

from io import StringIO

data=StringIO('C:\Users\Owner\Downloads\NIS_2016\NIS_2016_Core.txt')

np.genfromtxt(data, delimiter=(3,2,2,2,2,11,2,2,3,2,3,2,2,2,3,2,5,

7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,

7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,2,3,

2,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,10,5,

2,2,4,2,3,3,3,3,3,3,3,3,3,3,3,3,3,3,

3,3,2,2,10,2,2,4,2))

2 - Используйте коды ICM-10, чтобы создать файл, с которым я буду работать ...

(Я еще не достигэтот момент еще.)

Большое спасибо за вашу помощь.

...