У меня есть сканер, который сканирует несколько PDF-файлов параллельно, многие PDF-файлы довольно большие, но не более 10 МБ или около того. В настоящее время я читаю контексты PDF в памяти примерно так:
var memoryStream = new MemoryStream();
extractedText = Encoding.UTF8.GetString(memoryStream.ToArray());
memoryStream.Dispose();
...
Как только содержимое прочитано, оно сохраняется в базе данных.
Однако у меня есть проблемы с производительностью по поводу этого подхода. Должен ли я вместо этого записать поток памяти на диск, а затем прочитать с диска?
Спасибо