У меня очень большой набор данных (~ 7 миллионов строк) из регистратора данных.Я хотел бы сэмплировать данные и копировать каждую 800-ю строку в новый текстовый файл.Это объясняется тем, что текстовый файл слишком велик для импорта в мое программное обеспечение для анализа.В идеале я хотел бы использовать пакетный скрипт или что-то подобное.Скорость очень важна, так как возможно, что будущие файлы данных могут быть еще больше.
В какой-то момент у меня было что-то вроде работы с использованием:
findstr/N . test.txt| findstr ^[0-9]*0: >temporaryFile
FOR /F "tokens=1,* delims=: " %%i in (temporaryfile) do echo %%j > outputFile.txt
, которая сохраняла бы одну строкуиз каждых 10. Я не очень знаком с синтаксисом, и в настоящее время он не работает должным образом.
Редактировать:
Решение, предложенное @LotPings, работает хорошо