Есть ли способ извлечь несколько фрагментов данных из текстового файла в Python и сохранить их в виде строки в новом файле .csv?Мне нужно сделать это для нескольких входных файлов и сохранить выходные данные в виде одного файла .csv для всех входных файлов.
Я никогда раньше не использовал Python, поэтому я совершенно не в курсе.Я использовал Matlab и раньше, и я знаю, как бы я сделал это в Matlab, если бы это были цифры (но, к сожалению, это текст, поэтому я пытаюсь Python).Поэтому для ясности мне нужна новая строка в выходном файле .csv для каждого «идентификатора» во входных файлах.Пример данных показан ниже (2 отдельных файла)
EXAMPLE DATA - FILE 1:
id,ARI201803290
version,2
info,visteam,COL
info,hometeam,ARI
info,site,PHO01
info,date,2018/03/29
id,ARI201803300
data,er,corbp001,2
version,2
info,visteam,COL
info,hometeam,ARI
info,site,PHO01
info,date,2018/03/30
data,er,delaj001,0
EXAMPLE DATA - FILE 2:
id,NYN201803290
version,2
info,visteam,SLN
info,hometeam,NYN
info,site,NYC20
info,usedh,false
info,date,2018/03/29
data,er,famij001,0
id,NYN201803310
version,2
info,visteam,SLN
info,hometeam,NYN
info,site,NYC20
info,date,2018/03/31
data,er,gselr001,0
Я надеюсь получить данные в формате .csv со всеми подробностями из одного «идентификатора» в 1 строке.В текстовом файле есть несколько идентификаторов, а также несколько файлов.Я хочу повторить этот процесс для нескольких текстовых файлов, чтобы выходные данные были в одном выходном файле .csv.Я хочу, чтобы вывод в файле .csv выглядел следующим образом: каждая ячейка информации представляла собой новую ячейку:
ARI201803290 COL ARI PHO01 2018/03/29 2
ARI201803300 COL ARI PHO01 2018/03/30 0
NYN201803290 SLN NYN NYC20 2018/03/29 0
NYN201803310 SLN NYN NYC20 2018/03/31 0
Если бы я делал это в Matlab, я бы использовал цикл for и оператор ifи скажем
j=1
k=1
for i=1:size(myMatrix, 1)
if file1(i;1)==id
output(k,1)=(i;2)
k=k+1
else if
file1(i;1)==info && file1(i;1)==info
output(j,2)=(i;3)
j=j+1
и т.д .....
Однако я, очевидно, не могу сделать это в Matlab, потому что у меня есть текстовые файлы, разделенные запятыми, а не матрица.У кого-нибудь есть предложения, как я могу перевести свою идею в код Python?Или любое другое предложение.Я новичок в Python, поэтому хочу попробовать все, что может сработать.
Заранее большое спасибо!