Учитывая следующее из MSDN:
Regex объекты могут быть созданы в любом потоке и могут быть разделены между потоками.
Я обнаружил, что для производительности лучше НЕ для совместного использования экземпляра Regex
между потоками при использовании класса ThreadLocal
.
Кто-нибудь может объяснить, почему он работает примерно в 5 раз быстрее для локального экземпляра потока?
Вот результаты (на 8-ядерном компьютере):
Using Regex singleton' returns 3000000 and takes 00:00:01.1005695
Using thread local Regex' returns 3000000 and takes 00:00:00.2243880
Исходный код:
using System;
using System.Linq;
using System.Threading;
using System.Text.RegularExpressions;
using System.Diagnostics;
namespace ConsoleApplication1
{
class Program
{
static readonly string str = new string('a', 400);
static readonly Regex re = new Regex("(a{200})(a{200})", RegexOptions.Compiled);
static void Test(Func<Regex> regexGettingMethod, string methodDesciption)
{
Stopwatch sw = new Stopwatch();
sw.Start();
var sum = Enumerable.Repeat(str, 1000000).AsParallel().Select(s => regexGettingMethod().Match(s).Groups.Count).Sum();
sw.Stop();
Console.WriteLine("'{0}' returns {1} and takes {2}", methodDesciption, sum, sw.Elapsed);
}
static void Main(string[] args)
{
Test(() => re, "Using Regex singleton");
var threadLocalRe = new ThreadLocal<Regex>(() => new Regex(re.ToString(), RegexOptions.Compiled));
Test(() => threadLocalRe.Value, "Using thread local Regex");
Console.Write("Press any key");
Console.ReadKey();
}
}
}