Эффективность времени и пространства: запись сразу на диск или временное сохранение в памяти? - PullRequest
0 голосов
/ 23 апреля 2020

Я изучаю информационно-поисковые системы и в настоящее время работаю с частичными индексами и файлами произвольного доступа.

В настоящее время я работаю над созданием файла словаря, файла публикаций и файла документа. Допустим, я читаю статьи из своего корпуса и хочу создать эти файлы выше. Я знаю, что для файла словаря и файла публикаций более эффективно временно сохранить их в памяти (как в хэш-карте), а затем, если он достигнет предела и моя память достигнет значения sh, сохраните его на диске (который означает, что создан частичный индекс). Затем после создания всех частичных индексов объединяем их вместе. Но то же самое с файлом документа? Я имею в виду, что если с самого начала я начну записывать файл документов на диск? Разве не предпочтительнее, так как я экономлю время от огромного слияния в каждом частичном индексе или запись на диск занимает больше времени?

...