У меня есть набор данных, который выглядит так
codebit 00 all words BL 0
running test
DATA1
0.000 1.23
0.050 11.34
0.100 21.26
.....
codebit 01 all words BL 1
running test
DATA1
0.000 0.2
0.050 11.68
0.100 12.21
....
Мне нужно регулярное выражение, чтобы найти кодовый бит и BL , а затем запустить ищем слово «ДАННЫЕ1» (оно является общим для всех наборов данных) и берем данные под ним, чтобы построить графики с разными именами. Я реализовал часть DATA1. Это работает, когда есть небольшие наборы данных, но для больших наборов это займет много времени. Мне нужен был автоматизированный способ сделать это. Мой код выглядит так:
file = pd.read_table('sample.txt')
file[['time', 'instances']] = file['DATA1'].str.split(expand=True)
dist = file["instances"].tolist()
t = file["time"].tolist()
t= list(map(float,t))
dist = list(map(int, dist))
plt.plot(t,dist)
plt.yscale('log')
plt.title("PLOT")
plt.xlabel("TIME")
plt.ylabel("INSTANCES")
pylab.show()
С помощью этого кода я копирую часть данных после DATA1, вставляю ее в файл sample.txt и запускаю свой код. И это дает мне сюжет.