Понимание памяти и скорости процессора - PullRequest
0 голосов
/ 11 апреля 2010

Во-первых, я работаю на машине с Windows XP 64 с 4 Гб оперативной памяти и 2,29 ГГц x4

Я индексирую 220 000 строк текста более или менее одинаковой длины. Они разделены на 15 файлов одинакового размера. Файл 1/15 занимает 1 минуту для индексации. Поскольку скрипт индексирует больше файлов, он занимает гораздо больше времени, а файл 15/15 занимает 40 минут.

Насколько я понимаю, чем больше я помещаю в память, тем быстрее работает скрипт. Словарь индексируется в хэше, поэтому операции выборки должны быть O (1). Я не уверен, где скрипт будет зависать процессор.

У меня есть сценарий здесь .

1 Ответ

1 голос
/ 11 апреля 2010

Вы можете попытаться контролировать свою машину, чтобы увидеть, не хватает ли памяти. Если это так, вы можете искать утечки памяти в вашем коде.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...