Оптимизация внедрения Карацубы - PullRequest
8 голосов
/ 02 февраля 2010

Итак, я пытаюсь улучшить некоторые операции, предоставляемые классом .net 4 BigInteger, поскольку операции выглядят квадратичными. Я сделал грубую реализацию Карацубы, но она все еще медленнее, чем я ожидал.

Основная проблема, по-видимому, заключается в том, что BigInteger не предоставляет простого способа подсчета количества битов, и поэтому я должен использовать BigInteger.Log (..., 2). Согласно Visual Studio, около 80-90% времени тратится на вычисление логарифмов.

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Numerics;

namespace Test
{
    class Program
    {
        static BigInteger Karatsuba(BigInteger x, BigInteger y)
        {
            int n = (int)Math.Max(BigInteger.Log(x, 2), BigInteger.Log(y, 2));
            if (n <= 10000) return x * y;

            n = ((n+1) / 2);

            BigInteger b = x >> n;
            BigInteger a = x - (b << n);
            BigInteger d = y >> n;
            BigInteger c = y - (d << n);

            BigInteger ac = Karatsuba(a, c);
            BigInteger bd = Karatsuba(b, d);
            BigInteger abcd = Karatsuba(a+b, c+d);

            return ac + ((abcd - ac - bd) << n) + (bd << (2 * n));
        }

        static void Main(string[] args)
        {
            BigInteger x = BigInteger.One << 500000 - 1;
            BigInteger y = BigInteger.One << 600000 + 1;
            BigInteger z = 0, q;

            Console.WriteLine("Working...");
            DateTime t;

            // Test standard multiplication
            t = DateTime.Now;
            z = x * y;
            Console.WriteLine(DateTime.Now - t);

            // Test Karatsuba multiplication
            t = DateTime.Now;
            q = Karatsuba(x, y);
            Console.WriteLine(DateTime.Now - t);

            // Check they're equal
            Console.WriteLine(z == q);

            Console.Read();
        }
    }
}

Итак, что я могу сделать, чтобы ускорить его?

1 Ответ

12 голосов
/ 20 февраля 2011

Зачем считать все биты?

В VB я делаю это:

<Runtime.CompilerServices.Extension()> _
Function BitLength(ByVal n As BigInteger) As Integer
    Dim Data() As Byte = n.ToByteArray
    Dim result As Integer = (Data.Length - 1) * 8
    Dim Msb As Byte = Data(Data.Length - 1)
    While Msb
        result += 1
        Msb >>= 1
    End While
    Return result
End Function

В C # это будет:

public static int BitLength(this BigInteger n)
{
    byte[] Data = n.ToByteArray();
    int result = (Data.Length - 1) * 8;
    byte Msb = Data[Data.Length - 1];
    while (Msb != 0) {
        result += 1;
        Msb >>= 1;
    }
    return result;
}

Наконец ...

    static BigInteger Karatsuba(BigInteger x, BigInteger y)
    {
        int n = (int)Math.Max(x.BitLength(), y.BitLength());
        if (n <= 10000) return x * y;

        n = ((n+1) / 2);

        BigInteger b = x >> n;
        BigInteger a = x - (b << n);
        BigInteger d = y >> n;
        BigInteger c = y - (d << n);

        BigInteger ac = Karatsuba(a, c);
        BigInteger bd = Karatsuba(b, d);
        BigInteger abcd = Karatsuba(a+b, c+d);

        return ac + ((abcd - ac - bd) << n) + (bd << (2 * n));
    }

Вызов метода расширения может замедлить процесс, поэтому, возможно, это будет быстрее:

int n = (int)Math.Max(BitLength(x), BitLength(y));

К вашему сведению: с помощью метода длины в битах вы также можете рассчитать хорошее приближение журнала намного быстрее, чем метод BigInteger.

bits = BitLength(a) - 1;
log_a = (double)i * log(2.0);

Что касается доступа к внутреннему массиву UInt32 структуры BigInteger, то для этого есть хак.

импортировать пространство имен отражения

Private Shared ArrM As MethodInfo
Private Shard Bits As FieldInfo
Shared Sub New()
    ArrM = GetType(System.Numerics.BigInteger).GetMethod("ToUInt32Array", BindingFlags.NonPublic Or BindingFlags.Instance)
    Bits = GetType(System.Numerics.BigInteger).GetMember("_bits", BindingFlags.NonPublic Or BindingFlags.Instance)(0)

End Sub
<Extension()> _
Public Function ToUInt32Array(ByVal Value As System.Numerics.BigInteger) As UInteger()
    Dim Result() As UInteger = ArrM.Invoke(Value, Nothing)
    If Result(Result.Length - 1) = 0 Then
        ReDim Preserve Result(Result.Length - 2)
    End If
    Return Result
End Function

Тогда вы можете получить базовый UInteger () большого целого числа как

 Dim Data() As UInteger = ToUInt32Array(Value)
 Length = Data.Length 

или поочередно

Dim Data() As UInteger = Value.ToUInt32Array()

Обратите внимание, что _bits fieldinfo может использоваться для прямого доступа к базовому полю UInteger () _bits структуры BigInteger. Это быстрее, чем вызов метода ToUInt32Array (). Однако, когда BigInteger B <= UInteger.MaxValue _bits - ничто. Я подозреваю, что в качестве оптимизации, когда BigInteger соответствует размеру 32-битного (машинного размера) слова, которое MS возвращает, выполняет обычную машинную арифметику с использованием собственного типа данных. </p>

Я также не смог использовать _bits.SetValue (B, Data ()), как вы обычно могли бы использовать отражение. Чтобы обойти это, я использую конструктор BigInteger (bytes () b), который имеет накладные расходы. В c # вы можете использовать небезопасные операции с указателями для приведения UInteger () к Byte (). Поскольку в VB нет указателей, я использую Buffer.BlockCopy. При доступе к данным таким образом важно отметить, что, если установлен MSB массива bytes (), MS интерпретирует его как отрицательное число. Я бы предпочел, чтобы они сделали конструктор с отдельным полем для знака. Массив слов для добавления дополнительного байта 0, чтобы снять флажок MSB

Кроме того, при возведении в квадрат вы можете улучшаться еще больше

 Function KaratsubaSquare(ByVal x As BigInteger)
    Dim n As Integer = BitLength(x) 'Math.Max(BitLength(x), BitLength(y))

    If (n <= KaraCutoff) Then Return x * x
    n = ((n + 1) >> 1)

    Dim b As BigInteger = x >> n
    Dim a As BigInteger = x - (b << n)
    Dim ac As BigInteger = KaratsubaSquare(a)
    Dim bd As BigInteger = KaratsubaSquare(b)
    Dim c As BigInteger = Karatsuba(a, b)
    Return ac + (c << (n + 1)) + (bd << (2 * n))

End Function

Это исключает 2 смены, 2 сложения и 3 вычитания из каждой рекурсии вашего алгоритма умножения.

...