Загрузка большого PDF в поток - PullRequest
0 голосов
/ 28 августа 2018

У меня есть сканер, который сканирует несколько PDF-файлов параллельно, многие PDF-файлы довольно большие, но не более 10 МБ или около того. В настоящее время я читаю контексты PDF в памяти примерно так:

      var memoryStream = new MemoryStream();
      extractedText = Encoding.UTF8.GetString(memoryStream.ToArray());
      memoryStream.Dispose();
      ...

Как только содержимое прочитано, оно сохраняется в базе данных.

Однако у меня есть проблемы с производительностью по поводу этого подхода. Должен ли я вместо этого записать поток памяти на диск, а затем прочитать с диска?

Спасибо

...