Question

У меня есть CSV-файл с около 2 миллионов строк.Этот CSV-файл имеет столбец, который я установил в качестве индекса (столбец A).Индекс теперь имеет 1,6 миллиона уникальных значений, распределенных по 12 разделам.Когда я делаю групповое применение к индексу , это занимает больше времени, чем 10 минут .Для одного файла это не проблема, но мне нужно сделать это для 600+ файлов.У меня такое ощущение, что я делаю что-то не так, но не могу определить узкое место, есть идеи?

График моей задачи:

Поток задачвыглядит так:

Почему sort_index во время группового индекса занимает относительно много времени?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Почему sort_index во время группового индекса занимает относительно много времени?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы