Как симулировать регулярные выражения в LINQ-to-SQL - PullRequest
12 голосов
/ 19 апреля 2011

У меня есть таблица базы данных с номерами учетных записей клиентов.В одной и той же таблице находятся тестовые аккаунты, которые не соответствуют производственному форматированию: скажем, «A1111» - это производство, а «JTest» - нет.У меня есть Regex, который будет тянуть только мои производственные счета.Мне нужен конкретный скомпилированный запрос, чтобы вытащить только производственные учетные записи.Запрос дает мне количество клиентов по регионам и дате;и концепция рассчитывает в каждом регионе:

        getCustomerDistribution = CompiledQuery.Compile<DataContext, String, DateTime, IEnumerable<ServerLoad>>(
            (context, region, processDate) => (from cust in context.GetTable<tbl_CustomerDistro>()
                                               where cust.ProcessedDate.Date == processDate.Date
                                               where cust.Region == region
                                               where Regex.IsMatch(cust.AcctNum, ProductionMask)
                                               group cust by new
                                               {
                                                   cust.Region,
                                                   cust.Concept
                                               } into custDistro
                                               orderby custDistro.Key.Region
                                               select new CustomerDistro
                                               (
                                                   custDistro.Key.Region,
                                                   custDistro.Key.Concept,
                                                   custDistro
                                                    .Where(c => c.Concept == custDistro.Key.Concept)
                                                    .Select(c => c.Concept).Count()
                                               )));

Проблема в том, что я получаю следующее сообщение во время выполнения:

Метод 'Boolean IsMatch (System.String, System.String) 'не поддерживает перевод на SQL.

Я искал пользовательский func:

static Func<striing, bool> IsProduction = (AcctNum) => Regex.IsMatch(AcctNum, ProductionMask);

Это тоже не работает.Я не хочу повторять получаемые записи для дальнейшей фильтрации, если только нет другого способа сделать это.

Есть ли способ сделать это с помощью Predicate Builder?

Обновление:

Другой вариант, который, я думаю, будет использовать:

where SqlMethods.Like (cust.AcctNum, ProductionMask)

Однако моя ProductionMask написана для Regex:

^[B,G]\d{4}$

Есть ли способ сделать это с помощью SqlMethods.Like (...)?

Обновление 2:

Это очень медленный запрос.У меня есть 3 региона, с которыми выполняется этот запрос, и количество записей и время возврата:
263: 903 мс
342: 822 мс
146: 711 мс

Ответы [ 5 ]

10 голосов
/ 20 апреля 2011

Я изменил запрос, чтобы использовать вместо Regex.IsMatch следующее:

where SqlMethods.Like(cust.Acct, ProductionMask)  

где ProductionMask = "[bBgG][0-9][0-9][0-9][0-9]"

Эквивалент RegEx: ^[B,G]\d{4}$

Если кто-нибудь видит, что две маски не должны давать одинаковые результаты, пожалуйста, дайте мне знать ...

6 голосов
/ 19 апреля 2011

Вы используете LINQ-to-SQL? Если это так, Форумы MSDN утверждают следующее:

LINQ to SQL не может переводить регулярно выражения в SQL, потому что нет поддержка Regex в конце SQL.

Это дает 3 альтернативы.

5 голосов
/ 24 мая 2013

особая благодарность Роману Храмцову и db_developer за справочную информацию, и благодаря Microsoft: P

Расширение RegExpLike для Sql Server

Справочные ссылки:
http://www.codeproject.com/Articles/42764/Regular-Expressions-in-MS-SQL-Server-2005-2008
http://msdn.microsoft.com/en-us/library/dd456847.aspx

Шаг 1: Скомпилируйте SqlRegularExpressions.cs для генерации SqlRegularExpressions.dll

// SqlRegularExpressions.cs
// © Copyright 2009, Roman Khramtsov / Major League - SqlRegularExpressions

using System;
using System.Data.SqlTypes;         //SqlChars
using System.Collections;           //IEnumerable
using System.Text.RegularExpressions;   //Match, Regex
using Microsoft.SqlServer.Server;       //SqlFunctionAttribute

/// <summary>
/// Class that allows to support regular expressions in MS SQL Server 2005/2008
/// </summary>
public partial class SqlRegularExpressions
{
    /// <summary>
    /// Checks string on match to regular expression
    /// </summary>
    /// <param name="text">string to check</param>
    /// <param name="pattern">regular expression</param>
    /// <returns>true - text consists match one at least, false - no matches</returns>
    [SqlFunction]
    public static bool Like(string text, string pattern, int options)
    {
        return (Regex.IsMatch(text, pattern, (RegexOptions)options));
    }

    /// <summary>
    /// Gets matches from text using pattern
    /// </summary>
    /// <param name="text">text to parse</param>
    /// <param name="pattern">regular expression pattern</param>
    /// <returns>MatchCollection</returns>
    [SqlFunction(FillRowMethodName = "FillMatch")]
    public static IEnumerable GetMatches(string text, string pattern, int options)
    {
        return Regex.Matches(text, pattern, (RegexOptions)options);
    }

    /// <summary>
    /// Parses match-object and returns its parameters 
    /// </summary>
    /// <param name="obj">Match-object</param>
    /// <param name="index">TThe zero-based starting position in the original string where the captured
    ///     substring was found</param>
    /// <param name="length">The length of the captured substring.</param>
    /// <param name="value">The actual substring that was captured by the match.</param>
    public static void FillMatch(object obj, out int index, out int length, out SqlChars value)
    {
        Match match = (Match)obj;
        index = match.Index;
        length = match.Length;
        value = new SqlChars(match.Value);
    }

}

Шаг 2: Запустите DbInstall.sql SQL для базы данных

DbInstall.sql

sp_configure 'clr enabled', 1
reconfigure
go

--needs full path to DLL
create assembly SqlRegularExpressions 
from '..\SqlRegularExpressions.dll' 
with PERMISSION_SET = SAFE
go

create function RegExpLike(@Text nvarchar(max), @Pattern nvarchar(255), @Options int = 0) 
returns bit 
as external name SqlRegularExpressions.SqlRegularExpressions.[Like]
go

create function RegExpMatches(@text nvarchar(max), @pattern nvarchar(255), @Options int = 0)
returns table ([Index] int, [Length] int, [Value] nvarchar(255))
as external name SqlRegularExpressions.SqlRegularExpressions.GetMatches
go

DbUninstall.sql

drop function RegExpLike
drop function RegExpMatches

drop assembly SqlRegularExpressions
go

sp_configure 'clr enabled', 0
reconfigure
go

Шаг 3: На диаграмме модели щелкните правой кнопкой мыши, выберите «Обновить модель из базы данных ...», используйте мастер обновления, чтобы добавить сохраненные функции в модель.
Model diagram context menu Update wizard Model browser

Шаг 4: Создание импортированных функций в классе контекста сущности.

public class TheCompanyContext : Entities
{
        // Please check your entity store name
        [EdmFunction("TheCompanyDbModel.Store", "RegExpLike")]
        public bool RegExpLike(string text, string pattern, int options)
        {
            throw new NotSupportedException("Direct calls are not supported.");
        }
}

Шаг 5: Наконец, вы можете использовать регулярные выражения в LINQ to Entities:)

User[] qry = (from u in context.Users
              where u.ApplicationName == pApplicationName
                 && context.RegExpLike(u.Username, usernameToMatch, (int)RegexOptions.IgnoreCase)
              orderby u.Username
              select u)
             .Skip(startIndex)
             .Take(pageSize)
             .ToArray();
1 голос
/ 19 апреля 2011

Не могли бы вы заменить Regex.IsMatch на

where cust.AcctNum.StartsWith(ProductionMask)

Или содержит / заканчивается в зависимости от ваших потребностей

0 голосов
/ 24 мая 2013

У меня была такая же проблема, но мне удалось от нее избавиться. Я знаю, что это медленно, но работает, любые советы по оптимизации / исправлению ошибок будут приветствоваться :) Код сначала собирает данные, а затем обрабатывает так что вам нужно отфильтровать как можно больше, прежде чем звонить toarray() или купить больше оперативной памяти :))
Надеюсь, поможет, наслаждаться

Regex rx = LikeToRegEx(emailToMatch);

User[] qry = (from u in context.Users
              where u.ApplicationName == pApplicationName
              orderby u.Username
              select u)
             .ToArray()
             .Where(u => rx.IsMatch(u.Email))
             .ToArray();

 // -- LikeToRegEx : Converts SQL like match pattern to a regular expression -- 
 public Regex LikeToRegEx(string likestr, RegexOptions opt = RegexOptions.None)
 {
            likestr = likestr
                     .Replace("*", ".")
                     .Replace("+", ".")
                     .Replace("(", ".")
                     .Replace("[", ".")
                     .Replace("/", ".")
                     .Replace("\\", ".")
                     .Replace("^", ".")
                     .Replace("$", ".")
                     .Replace("_", ".")
                     .Replace("%", ".*");

            return new Regex(likestr, opt);
 }

P.S. Это быстрый способ обработки легких таблиц данных, вы можете улучшить его, просто выбрав необходимые столбцы для обработки и просто столбцы идентификаторов возврата для полного доступа к строкам. Вы можете использовать мой последний пост для более общих тяжелых сценариев. Выбор за вами.

...