Я некоторое время искал решение этой проблемы, и я действительно застрял!У меня есть очень большой текстовый файл, импортированный как фрейм данных panda, содержащий всего два столбца, но с сотнями тысяч до миллионов строк.Столбцы содержат дампы пакетов: один - это данные пакетов, отформатированные как ascii-представления монотонно растущих целых чисел, а второй - время пакета.Я хочу пройти через этот фрейм данных и убедиться, что фрейм данных монотонно увеличивается, и, если отсутствуют данные, вставить новые строки, чтобы список увеличился монотонно.т. е. столбец «data» должен быть заполнен соответствующим значением, но время должно быть изменено на «NaN» или «NULL» и т. д.
Ниже приведен образец данных:
data frame_time_epoch
303030303030303000 1527986052.485855896
303030303030303100 1527986052.491020305
303030303030303200 1527986052.496127062
303030303030303300 1527986052.501301944
303030303030303400 1527986052.506439335
Итак, у меня есть два вопроса:
1) Я пытался перебрать фрейм данных, используя itertuples, чтобы попытаться получить следующую строку, сравнить с текущей строкой, и если разница sбольше, чем 100, чтобы добавить новую строку, но, к сожалению, я боролся с этим, так как, кажется, нет хорошего способа восстановить строку после вызываемой.
2) Есть лилучший (более быстрый) способ сделать это, чем я предлагал?
Это может быть тривиально, хотя я действительно боролся с этим.Заранее благодарю за помощь.