Самый быстрый / самый безопасный поиск / анализ файла? - PullRequest
5 голосов
/ 17 марта 2012

На c: у меня десятки тысяч *.foobar файлов.Они в самых разных местах (например, в подкаталогах).Эти файлы имеют размер примерно 1 - 64 КБ и открытый текст.

У меня есть class Foobar(string fileContents), который строго печатает эти .foobar файлы.

Моя задача состоит в том, чтобы получить список всех*.foobar файлы c:, представленные в виде массива Foobar объектов.Какой самый быстрый способ сделать это?

Мне интересно узнать, есть ли лучший способ (несомненно), чем мой первый подход, который следует, и если у этого подхода есть какие-либо потенциальные проблемы (например, я/ O проблемы параллелизма, генерирующие исключения?):

var files = Directory.EnumerateFiles
                (rootPath, "*.foobar", SearchOption.AllDirectories);

Foobar[] foobars = 
    from filePath in files.AsParallel()
    let contents = File.ReadAllText(filePath)
    select new Foobar(contents)

Ответы [ 2 ]

8 голосов
/ 18 марта 2012

Поскольку ошибки прав доступа (или другие ошибки), по-видимому, могут остановить перечисление мертвым на его пути, вы можете захотеть реализовать свой собственный перечислитель примерно так:

class SafeFileEnumerator : IEnumerable<string>
  private string root;
  private string pattern;
  private IList<Exception> errors;
  public SafeFileEnumerator(string root, string pattern)
     this.root = root;
     this.pattern = pattern;
     this.errors = new List<Exception>();

  public SafeFileEnumerator(string root, string pattern, IList<Exception> errors)
     this.root = root;
     this.pattern = pattern;
     this.errors = errors;

  public Exception[] Errors()
     return errors.ToArray();
  class Enumerator : IEnumerator<string>
     IEnumerator<string> fileEnumerator;
     IEnumerator<string> directoryEnumerator;
     string root;
     string pattern;
     IList<Exception> errors;

     public Enumerator(string root, string pattern, IList<Exception> errors)
        this.root = root;
        this.pattern = pattern;
        this.errors = errors;
        fileEnumerator = System.IO.Directory.EnumerateFiles(root, pattern).GetEnumerator();
        directoryEnumerator = System.IO.Directory.EnumerateDirectories(root).GetEnumerator();
     public string Current
           if (fileEnumerator == null) throw new ObjectDisposedException("FileEnumerator");
           return fileEnumerator.Current;

     public void Dispose()
        if (fileEnumerator != null)
        fileEnumerator = null;
        if (directoryEnumerator != null)
        directoryEnumerator = null;

     object System.Collections.IEnumerator.Current
        get { return Current; }

     public bool MoveNext()
        if ((fileEnumerator != null) && (fileEnumerator.MoveNext()))
           return true;
        while ((directoryEnumerator != null) && (directoryEnumerator.MoveNext()))
           if (fileEnumerator != null)
              fileEnumerator = new SafeFileEnumerator(directoryEnumerator.Current, pattern, errors).GetEnumerator();
           catch (Exception ex)
           if (fileEnumerator.MoveNext())
              return true;
        if (fileEnumerator != null)
        fileEnumerator = null;
        if (directoryEnumerator != null)
        directoryEnumerator = null;
        return false;

     public void Reset()
        fileEnumerator = System.IO.Directory.EnumerateFiles(root, pattern).GetEnumerator();
        directoryEnumerator = System.IO.Directory.EnumerateDirectories(root).GetEnumerator();
  public IEnumerator<string> GetEnumerator()
     return new Enumerator(root, pattern, errors);

  System.Collections.IEnumerator System.Collections.IEnumerable.GetEnumerator()
     return GetEnumerator();
4 голосов
/ 22 ноября 2013

Отличная работа, вот расширение вашего кода, возвращающее FileSystemInfo вместо строковых путей. Некоторые незначительные изменения в строке, такие как добавление в SearchOption (как в нативном .net), и перехват ошибок в начальном каталоге, если доступ к корневой папке запрещен. Еще раз спасибо за оригинальное сообщение!

public class SafeFileEnumerator : IEnumerable<FileSystemInfo>
    /// <summary>
    /// Starting directory to search from
    /// </summary>
    private DirectoryInfo root;

    /// <summary>
    /// Filter pattern
    /// </summary>
    private string pattern;

    /// <summary>
    /// Indicator if search is recursive or not
    /// </summary>
    private SearchOption searchOption;

    /// <summary>
    /// Any errors captured
    /// </summary>
    private IList<Exception> errors;

    /// <summary>
    /// Create an Enumerator that will scan the file system, skipping directories where access is denied
    /// </summary>
    /// <param name="root">Starting Directory</param>
    /// <param name="pattern">Filter pattern</param>
    /// <param name="option">Recursive or not</param>
    public SafeFileEnumerator(string root, string pattern, SearchOption option)
        : this(new DirectoryInfo(root), pattern, option)

    /// <summary>
    /// Create an Enumerator that will scan the file system, skipping directories where access is denied
    /// </summary>
    /// <param name="root">Starting Directory</param>
    /// <param name="pattern">Filter pattern</param>
    /// <param name="option">Recursive or not</param>
    public SafeFileEnumerator(DirectoryInfo root, string pattern, SearchOption option)
        : this(root, pattern, option, new List<Exception>()) 

    // Internal constructor for recursive itterator
    private SafeFileEnumerator(DirectoryInfo root, string pattern, SearchOption option, IList<Exception> errors)
        if (root == null || !root.Exists)
            throw new ArgumentException("Root directory is not set or does not exist.", "root");
        this.root = root;
        this.searchOption = option;
        this.pattern = String.IsNullOrEmpty(pattern)
            ? "*"
            : pattern;
        this.errors = errors;

    /// <summary>
    /// Errors captured while parsing the file system.
    /// </summary>
    public Exception[] Errors
            return errors.ToArray();

    /// <summary>
    /// Helper class to enumerate the file system.
    /// </summary>
    private class Enumerator : IEnumerator<FileSystemInfo>
        // Core enumerator that we will be walking though
        private IEnumerator<FileSystemInfo> fileEnumerator;
        // Directory enumerator to capture access errors
        private IEnumerator<DirectoryInfo> directoryEnumerator;

        private DirectoryInfo root;
        private string pattern;
        private SearchOption searchOption;
        private IList<Exception> errors;

        public Enumerator(DirectoryInfo root, string pattern, SearchOption option, IList<Exception> errors)
            this.root = root;
            this.pattern = pattern;
            this.errors = errors;
            this.searchOption = option;


        /// <summary>
        /// Current item the primary itterator is pointing to
        /// </summary>
        public FileSystemInfo Current
                //if (fileEnumerator == null) throw new ObjectDisposedException("FileEnumerator");
                return fileEnumerator.Current as FileSystemInfo;

        object System.Collections.IEnumerator.Current
            get { return Current; }

        public void Dispose()
            Dispose(true, true);

        private void Dispose(bool file, bool dir)
            if (file)
                if (fileEnumerator != null)

                fileEnumerator = null;

            if (dir)
                if (directoryEnumerator != null)

                directoryEnumerator = null;

        public bool MoveNext()
            // Enumerate the files in the current folder
            if ((fileEnumerator != null) && (fileEnumerator.MoveNext()))
                return true;

            // Don't go recursive...
            if (searchOption == SearchOption.TopDirectoryOnly) { return false; }

            while ((directoryEnumerator != null) && (directoryEnumerator.MoveNext()))
                Dispose(true, false);

                    fileEnumerator = new SafeFileEnumerator(
                catch (Exception ex)

                // Open up the current folder file enumerator
                if (fileEnumerator.MoveNext())
                    return true;

            Dispose(true, true);

            return false;

        public void Reset()

            // Safely get the enumerators, including in the case where the root is not accessable
            if (root != null)
                    fileEnumerator = root.GetFileSystemInfos(pattern, SearchOption.TopDirectoryOnly).AsEnumerable<FileSystemInfo>().GetEnumerator();
                catch (Exception ex)
                    fileEnumerator = null;

                    directoryEnumerator = root.GetDirectories(pattern, SearchOption.TopDirectoryOnly).AsEnumerable<DirectoryInfo>().GetEnumerator();
                catch (Exception ex)
                    directoryEnumerator = null;
    public IEnumerator<FileSystemInfo> GetEnumerator()
        return new Enumerator(root, pattern, searchOption, errors);

    System.Collections.IEnumerator System.Collections.IEnumerable.GetEnumerator()
        return GetEnumerator();