Спасибо за чтение моего поста.Я застрял ... Я использую Национальный стационарный образец (NIS) 2016, который представляет собой набор данных из семи миллионов больничных записей.Мне нужно изолировать матерей, которые родили, и их новорожденных, что составляет 850,00 записей.
Набор данных в формате ASCII , который необходимо преобразовать в формат, который я могуиспользовать в Python.Оттуда мне нужно использовать коды ICM-10 для всех случаев родов, для матери и ее ребенка (детей), чтобы создать новый набор данных, который я использую для анализа данных.
Итак, мои шаги следующие:
1 - преобразовать ASCII во что-то, что Python может использовать, и убедитесь, что программа правильно считывает данные в соответствии с числовыми или строковыми значениями.Я не могу сделать эту работу;Кто-нибудь может мне помочь с кодом?
import numpy as np
import matplotlib.pyplot as plt
from io import StringIO
data=StringIO('C:\Users\Owner\Downloads\NIS_2016\NIS_2016_Core.txt')
np.genfromtxt(data, delimiter=(3,2,2,2,2,11,2,2,3,2,3,2,2,2,3,2,5,
7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,2,3,
2,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,10,5,
2,2,4,2,3,3,3,3,3,3,3,3,3,3,3,3,3,3,
3,3,2,2,10,2,2,4,2))
2 - Используйте коды ICM-10, чтобы создать файл, с которым я буду работать ...
(Я еще не достигэтот момент еще.)
Большое спасибо за вашу помощь.