Общий класс для выполнения массово-параллельных запросов.Обратная связь? - PullRequest
10 голосов
/ 27 декабря 2010

Я не понимаю, почему, но, похоже, в клиентской библиотеке нет механизма для параллельного выполнения множества запросов для Windows Azure Table Storage. Я создал шаблонный класс, который можно использовать для экономии значительного времени, и вы можете использовать его по своему усмотрению. Я был бы признателен, однако, если бы вы могли выделить его отдельно и дать отзыв о том, как улучшить этот класс.

public class AsyncDataQuery<T> where T: new()
{
    public AsyncDataQuery(bool preserve_order)
    {
        m_preserve_order = preserve_order;
        this.Queries = new List<CloudTableQuery<T>>(1000);
    }

    public void AddQuery(IQueryable<T> query)
    {
        var data_query = (DataServiceQuery<T>)query;
        var uri = data_query.RequestUri; // required

        this.Queries.Add(new CloudTableQuery<T>(data_query));
    }

    /// <summary>
    /// Blocking but still optimized.
    /// </summary>
    public List<T> Execute()
    {
        this.BeginAsync();
        return this.EndAsync();
    }

    public void BeginAsync()
    {
        if (m_preserve_order == true)
        {
            this.Items = new List<T>(Queries.Count);
            for (var i = 0; i < Queries.Count; i++)
            {
                this.Items.Add(new T());
            }
        }
        else
        {
            this.Items = new List<T>(Queries.Count * 2);
        }

        m_wait = new ManualResetEvent(false);

        for (var i = 0; i < Queries.Count; i++)
        {
            var query = Queries[i];
            query.BeginExecuteSegmented(callback, i);
        }
    }

    public List<T> EndAsync()
    {
        m_wait.WaitOne();
        m_wait.Dispose();

        return this.Items;
    }

    private List<T> Items { get; set; }
    private List<CloudTableQuery<T>> Queries { get; set; }

    private bool m_preserve_order;
    private ManualResetEvent m_wait;
    private int m_completed = 0;
    private object m_lock = new object();

    private void callback(IAsyncResult ar)
    {
        int i = (int)ar.AsyncState;
        CloudTableQuery<T> query = Queries[i];
        var response = query.EndExecuteSegmented(ar);
        if (m_preserve_order == true)
        { // preserve ordering only supports one result per query
            lock (m_lock)
            {
                this.Items[i] = response.Results.Single();
            }
        }
        else
        { // add any number of items
            lock (m_lock)
            {
                this.Items.AddRange(response.Results);
            }
        }
        if (response.HasMoreResults == true)
        { // more data to pull
            query.BeginExecuteSegmented(response.ContinuationToken, callback, i);
            return;
        }
        m_completed = Interlocked.Increment(ref m_completed);
        if (m_completed == Queries.Count)
        {
            m_wait.Set();
        }
    }
}

Ответы [ 2 ]

5 голосов
/ 18 февраля 2012

Думаю, я опоздал на вечеринку.Я бы добавил две вещи:

  1. ManualResetEvent является IDisposable.Таким образом, вы должны убедиться, что он где-то утилизируется.
  2. Обработка ошибок - если один из запросов потерпит неудачу, он, вероятно, потерпит неудачу.Вероятно, вам следует повторить неудачные запросы.В качестве альтернативы вы можете вернуть значения, которые вы вернули, с указанием того, какие запросы были неудачными, чтобы вызывающий мог повторить запросы.
  3. Тайм-ауты на стороне клиента - их нет.Это не проблема, если для вас истекает время на стороне сервера, но в случае сбоя (например, из-за проблем с сетью) клиент зависнет навсегда.

Кроме того, я думаю, что на самом деле это лучший подход, чем Task Parallel Library.Я пробовал подход «Задача на запрос» до этого.Код был на самом деле более неуклюжим, и он имел тенденцию иметь lot активных потоков.Я до сих пор не проводил тщательного тестирования с вашим кодом, но, кажется, он работает лучше с первого взгляда.

Обновление

Я вложил некоторую работу в более или менее переписанный код выше.Моя перезапись удаляет все блокировки, поддерживает клиентские тайм-ауты зависших транзакций (редко, но это случается и может действительно испортить ваш день), а также некоторую логику обработки исключений.Существует полное решение с тестами на Bitbucket .Наиболее релевантный код находится в одном файле , хотя для него требуются некоторые помощники, которые находятся в других частях проекта.

4 голосов
/ 30 декабря 2010

Рассматривали ли вы использование параллельной библиотеки задач?

http://msdn.microsoft.com/en-us/library/dd537609.aspx

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...