HttpWebRequest Ограничения? Или плохая реализация - PullRequest
2 голосов
/ 14 июля 2009

Я пытаюсь создать консольное приложение на c #, которое будет отслеживать около 3000 URL-адресов (просто нужно знать, что запрос HEAD вернул 200, необязательно содержимое и т. Д.)

Моя попытка заключалась в том, чтобы создать подпрограмму, проверяющую веб-URL, зацикливание и создание потоков, каждый из которых выполняет подпрограмму. Происходит следующее: если я запускаю с <20 потоками, большую часть времени он работает нормально, но если я использую> 20 потоков, некоторые из них истекают. Я попытался увеличить время ожидания до 30 секунд, то же самое происходит. Сеть, в которой я работаю, более чем способна выполнить 50 запросов HTTP HEAD (соединение 10 Мбит / с у провайдера Интернет-услуг), и при выполнении подпрограммы и процессор, и сеть работают очень слабо.

Когда происходит тайм-аут, я проверяю тот же IP в браузере, и он работает нормально, я неоднократно проверял это, и во время тестирования никогда не было случая, чтобы истек срок ожидания по URL-адресу "time-out".

Причина, по которой я хочу запустить> 20 потоков, состоит в том, что я хочу выполнять этот тест каждые 5 минут, при этом некоторые URL-адреса занимают полные 10 секунд (или выше, если время ожидания установлено выше), я хочу убедиться, что Он может работать через все URL в течение 2-3 минут.

Есть ли лучший способ проверить, доступен ли URL-адрес, или, если я смотрю на систему / сеть на предмет проблемы.

MAIN

        while (rdr.Read())
        {
            Thread t = new Thread(new ParameterizedThreadStart(check_web));

            t.Start(rdr[0]);


        }

      static void check_web(object weburl)
      {
          bool isok;
          isok = ConnectionAvailable(weburl.ToString());
      }



      public static bool ConnectionAvailable(string strServer)
      {

          try
          {
              strServer = "http://" + strServer;
              HttpWebRequest reqFP = (HttpWebRequest)HttpWebRequest.Create(strServer);
              reqFP.Timeout = 10000;
              reqFP.Method = "HEAD";

              HttpWebResponse rspFP = (HttpWebResponse)reqFP.GetResponse();
              if (HttpStatusCode.OK == rspFP.StatusCode)
              {
                  Console.WriteLine(strServer + " - OK");
                  rspFP.Close();
                  return true;
              }
              else
              {
                  Console.WriteLine(strServer + " Server returned error..");
                  rspFP.Close();
                  return false;

              }

          }

          catch (WebException x)
          {
              if (x.ToString().Contains("timed out"))
              {
                  Console.WriteLine(strServer + " - Timed out");
              }
              else
              {
                  Console.WriteLine(x.Message.ToString());
              }

              return false;

          }

      }

Ответы [ 3 ]

8 голосов
/ 14 июля 2009

Просто запомни, ты спросил.

Очень плохая реализация.

  1. Не создавайте подобные темы. Очень мало пользы иметь больше потоков, чем процессорных ядер. Дополнительные потоки будут в значительной степени просто конкурировать друг с другом, тем более что они все выполняют один и тот же код.

  2. Вам необходимо реализовать использование блоков. Если вы выбрасываете исключение (и, скорее всего, так и будет), у вас будут утечки ресурсов.

  3. Какова цель возвращения бул? Вы это где-нибудь проверяли? В любом случае, ваша ошибка и обработка исключений - беспорядок.

    • Когда вы получаете ответ, отличный от 200, код ошибки не отображается.
    • Вы сравниваете со свойством Message, чтобы определить, истекло ли время ожидания. Microsoft должна поставить промежуток между «временем» и «вне» просто чтобы вас злить.
    • Если время не истекло, вы отображаете только свойство Message, а не все исключение, а свойство Message уже является строкой, и вам не нужно вызывать ToString () для него.

Следующая партия изменений

Это не закончено, я не думаю, но попробуйте это:

public static void Main()
{
    // Don't mind the interpretation. I needed an excuse to define "rdr"
    using (var conn = new SqlConnection())
    {
        conn.Open();
        using (var cmd = new SqlCommand("SELECT Url FROM UrlsToCheck", conn))
        {
            using (var rdr = cmd.ExecuteReader())
            {
                while (rdr.Read())
                {
                    // Use the thread pool. Please.
                    ThreadPool.QueueUserWorkItem(
                        delegate(object weburl)
                            {
                                // I invented a reason for you to return bool
                                if (!ConnectionAvailable(weburl.ToString()))
                                {
                                    // Console would be getting pretty busy with all
                                    // those threads
                                    Debug.WriteLine(
                                        String.Format(
                                            "{0} was not available",
                                            weburl));
                                }
                            },
                            rdr[0]);
                }
            }
        }
    }
}

public static bool ConnectionAvailable(string strServer)
{
    try
    {
        strServer = "http://" + strServer;
        var reqFp = (HttpWebRequest)WebRequest.Create(strServer);
        reqFp.Timeout = 10000;
        reqFp.Method = "HEAD";

        // BTW, what's an "FP"?
        using (var rspFp = (HttpWebResponse) reqFp.GetResponse()) // IDisposable 
        {
            if (HttpStatusCode.OK == rspFp.StatusCode)
            {
                Debug.WriteLine(string.Format("{0} - OK", strServer));
                return true; // Dispose called when using is exited
            }

            // Include the error because it's nice to know these things
            Debug.WriteLine(String.Format(
                 "{0} Server returned error: {1}", 
                 strServer, rspFp.StatusCode));
            return false;
        }
    }
    catch (WebException x)
    {
        // Don't tempt fate and don't let programs read human-readable messages
        if (x.Status == WebExceptionStatus.Timeout)
        {
            Debug.WriteLine(string.Format("{0} - Timed out", strServer));
        }
        else
        {
            // The FULL exception, please
            Debug.WriteLine(x.ToString());
        }

        return false;
    }
}

Почти готово - не проверено Ночной код

public static void Main()
{
    using (var conn = new SqlConnection())
    {
        conn.Open();
        using (var cmd = new SqlCommand("", conn))
        {
            using (var rdr = cmd.ExecuteReader())
            {
                if (rdr == null)
                {
                    return;
                }

                while (rdr.Read())
                {
                    ThreadPool.QueueUserWorkItem(
                        CheckConnectionAvailable, rdr[0]);
                }
            }
        }
    }
}

private static void CheckConnectionAvailable(object weburl)
{
    try
    {
        // If this works, it's a lot simpler
        var strServer = new Uri("http://" + weburl);
        using (var client = new WebClient())
        {
            client.UploadDataCompleted += ClientOnUploadDataCompleted;
            client.UploadDataAsync(
                strServer, "HEAD", new byte[] {}, strServer);
        }
    }
    catch (WebException x)
    {
        Debug.WriteLine(x);
    }
}

private static void ClientOnUploadDataCompleted(
    object sender, UploadDataCompletedEventArgs args)
{
    if (args.Error == null)
    {
        Debug.WriteLine(string.Format("{0} - OK", args.UserState));
    }
    else
    {
        Debug.WriteLine(string.Format("{0} - Error", args.Error));
    }
}
1 голос
/ 14 октября 2009

Не использовать темы.

Asynch Обратные вызовы и очереди. Зачем создавать поток, когда ресурс, который они все хотят, это доступ к внешнему миру. Ограничьте свои потоки примерно до 5, а затем реализуйте класс, который использует очередь. разделить код на две части: выборка и процесс. Один контролирует поток данных, а другой контролирует доступ к внешнему миру.

Используйте любой язык, который вам нравится, но вы не ошибетесь, если считаете, что потоки предназначены для обработки, а перехват номера и асинхронные обратные вызовы - для управления ресурсами.

1 голос
/ 14 июля 2009

Используйте ThreadPool класс. Не создавайте сотни таких тем. У потоков такие огромные накладные расходы, и в вашем случае происходит то, что ваш процессор будет тратить 99% времени на переключение контекста и 1% на реальную работу.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...