Преобразование из гекса в base64 - PullRequest
3 голосов
/ 03 июля 2019

Мне было поручено взять шестнадцатеричный текст и преобразовать его в систему base64.Моя проблема в том, что я получаю неправильный вывод из моего кода.

Введено:

49276d206b696c6c696e6720796f757220627261696e206c696b65206120706f69736f6e6f75 * * 1016 1016 1006 * 1016 1006 * 1016 1006 * 86 * 86f6606 * 6866606 * 87 * 86f6106 * 86f6606 * 61066756165Ожидаемый результат:

SSdtIGtpbGxpbmcgeW91ciBicmFpbiBsaWtlIGEgcG9pc29ub3VzIG11c2hyb29t

Выход из моей программы:

kk7aga2lY2NL5nIHLe6uiBicMLS3IGxp1spAhIHBe0ub9ub3rmQNXVzaOTe3

1025 *

Как я ожидаю, что мой код будет работать:

ПРИМЕЧАНИЕ: Я понимаю, что Python имеет встроенные способы преобразования чего-либо в base64,а также используя int () для преобразования любой базы в десятичную, я решил использовать свою собственную как способ понять проблему подробнее.

  1. Взять строку шестнадцатеричного текста и преобразоватьэто десятичное число.
  2. Преобразование десятичного числа в двоичное число.
  3. Разделение двоичного числа на куски по 24 бита.
  4. Разделить фрагмент из 24 бит на 4 секции по 6 бит в каждом.
  5. Преобразовать каждые 6 бит в десятичное число.
  6. Преобразовать десятичное число в кодировку base64буква / цифра.Начиная с «A» (индекс 0) до «/» (индекс 63)

Мой код:

def convertToDecimal(text, original_base):
    '''
    Program assumes user is using it correctly. It does not bother checking for weird cases like a base being 0 or a negative.
    '''

    decimal = 0  # used for converting to decimal base first
    exp = len(text) - 1  # starting exponent of the base (8^1, 8^0, etc)

    hex_nums = {"a": 10, "b": 11, "c": 12, "d": 13, "e": 14, "f": 15}

    # convert original_base to a decimal number
    for val in text:
        if val in hex_nums:  # have to worry about letters
            val = hex_nums[val]
        decimal += int(val) * (original_base ** exp)
        exp -= 1

    return decimal


def base64(text, base):
    letters = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"

    bin_num = bin(convertToDecimal(text, base))[2:]

    base64_val = ""

    # used for indexing each chunk of binary values
    i = 0
    j = 25

    # used for each chunk of six bits to be converted into a number
    six_bit_chunk = ""

    while True:
        if j > len(bin_num):
            # prevents index out of bounds error
            break

        bin_chunk = bin_num[i:j]  # take a chunk of 24 bits
        for x in range(0, 24, 6):
            six_bit_chunk += bin_chunk[x:x + 6]  # take a smaller chunk of 6 bits
            index = convertToDecimal(six_bit_chunk, 2)  # use the 6 bits to create a decimal value from 0-63
            base64_val += letters[index]
            six_bit_chunk = ""

        i += 25
        j += 25

    return base64_val


new_text = base64("49276d206b696c6c696e6720796f757220627261696e206c696b65206120706f69736f6e6f7573206d757368726f6f6d",
                  16)

print(new_text)

Мои попытки решитьэта проблема состояла в том, чтобы посмотреть, что производят куски шести битов, и они создают правильное десятичное число и правильную букву / число в base64.

Ответы [ 2 ]

1 голос
/ 03 июля 2019

Я не совсем уверен, что это правильно, но с несколькими изменениями я добился, чтобы выходные данные функции соответствовали ожидаемому результату, который вы предоставили.

Изменения (также с учетом комментария отuser @JamesKPolt):

  • везде, где у вас было 25 лет, вместо этого использовали 24 *
  • добавьте нулевое заполнение к началу bin_num, чтобы получить длину, кратную 24

Измененный код:

def base64(text, base):
    letters = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"

    bin_num = bin(convertToDecimal(text, base))[2:]

    # pad with zeros to the left to get multiple of 24
    remainder = divmod(len(bin_num), 24)[1]
    if remainder > 0:
        additional_zeros = 24 - remainder
        bin_num = ('0' * additional_zeros) + bin_num

    base64_val = ""

    # used for indexing each chunk of binary values
    i = 0
    j = 24

    # used for each chunk of six bits to be converted into a number
    six_bit_chunk = ""

    while True:
        if j > len(bin_num):
            # prevents index out of bounds error
            break

        bin_chunk = bin_num[i:j]  # take a chunk of 24 bits
        for x in range(0, 24, 6):
            six_bit_chunk += bin_chunk[x:x + 6]  # take a smaller chunk of 6 bits
            index = convertToDecimal(six_bit_chunk, 2)  # use the 6 bits to create a decimal value from 0-63
            base64_val += letters[index]
            six_bit_chunk = ""

        i += 24
        j += 24

    return base64_val

Эта измененная функция проходит все следующие тестовые случаи:

sample_data = [
    (
        '49276d206b696c6c696e6720796f757220627261696e206c696b65206120706f69736f6e6f7573206d757368726f6f6d',
        'SSdtIGtpbGxpbmcgeW91ciBicmFpbiBsaWtlIGEgcG9pc29ub3VzIG11c2hyb29t',
    ),
    (
        '24e1f218372064987d5457b639819715bddb51558cc4acb3ce6eeacd7afa2751bac0a5c7c3c636f24babff4ad68473db',
        'JOHyGDcgZJh9VFe2OYGXFb3bUVWMxKyzzm7qzXr6J1G6wKXHw8Y28kur/0rWhHPb',
    ),
    (
        '79d6e3a9d5bfba9902274e1b1c2d956fa92d16ba9a972825eb0b32aecd2401653624f900fe79b4550c24aae136ae7260',
        'edbjqdW/upkCJ04bHC2Vb6ktFrqalygl6wsyrs0kAWU2JPkA/nm0VQwkquE2rnJg',
    ),
    (
        'd251b89c473d6336dfeb3714d92c6b2080c863624ca2746e1380bd0642893ba64ebdae23bb7ad9a1f3ad9efbdc2f18e6',
        '0lG4nEc9Yzbf6zcU2SxrIIDIY2JMonRuE4C9BkKJO6ZOva4ju3rZofOtnvvcLxjm',
    ),
    (
        '5c2b578064178ad329f37041b063ec05c3ce8f202bb44e9a1260c6ded11ddd91d25ac83bba31bac7987e2da3a188c23d',
        'XCtXgGQXitMp83BBsGPsBcPOjyArtE6aEmDG3tEd3ZHSWsg7ujG6x5h+LaOhiMI9',
    ),
    (
        '018b79f5c3c1a4f59d12cda25c5ca2a29c4c1fdd1cfdf3f0a4faf350fe384d21bcfd83a8350b49231cf8536595f2a43a',
        'AYt59cPBpPWdEs2iXFyiopxMH90c/fPwpPrzUP44TSG8/YOoNQtJIxz4U2WV8qQ6',
    ),
    (
        'a617cfbe469cecd19f5ac75303a3049319ffb03d9a757c690d7c09d94dbabd6dce2314e1f409e6285fc0a0220eb803fe',
        'phfPvkac7NGfWsdTA6MEkxn/sD2adXxpDXwJ2U26vW3OIxTh9AnmKF/AoCIOuAP+',
    ),
    (
        '2bc40041dbe6937e1113b191fd136bcdd741169e9e81809e83ad3104d447d700ed9d1ab5cfbc113c0731b855fde98f87',
        'K8QAQdvmk34RE7GR/RNrzddBFp6egYCeg60xBNRH1wDtnRq1z7wRPAcxuFX96Y+H',
    ),
    (
        '1904435f5964861c5284b08e0ebf3d201da3ec795a3d9b0f7d5056c4369daed59d42cac72c897356a46305f7aac5fcb4',
        'GQRDX1lkhhxShLCODr89IB2j7HlaPZsPfVBWxDadrtWdQsrHLIlzVqRjBfeqxfy0',
    ),
]

for i, (input_str, expected_output) in enumerate(sample_data):
    print('i              ', i)
    print('input_str      ', input_str)
    print('expected_output', expected_output)

    function_output = base64(input_str, 16)
    print('function_output', function_output)
    assert expected_output == function_output
0 голосов
/ 04 июля 2019

Разве вы не можете просто перебрать двоичное представление в группах по 6, вместо того, чтобы группировать по 24 и снова разделять на 4 группы?

Но его все равно нужно заполнить нулями слева до кратного 24, прежде чем разбить на группы по 6.

Моя функция:

def base64_v2(text, base):
    base64_letters = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
    n1 = 24
    n2 = 6

    dec_num = int(text, base)
    bin_str = bin(dec_num)[2:]

    # pad with zeros to the left to get multiple of 'n1'
    remainder = divmod(len(bin_str), n1)[1]
    if remainder > 0:
        additional_zeros = n1 - remainder
        bin_str = ('0' * additional_zeros) + bin_str

    return ''.join(
        base64_letters[int(bin_str[i:i+n2], 2)]
        for i in range(0, len(bin_str), n2))

Моя функция проходит все следующие тестовые случаи:

sample_data = [
    (
        '49276d206b696c6c696e6720796f757220627261696e206c696b65206120706f69736f6e6f7573206d757368726f6f6d',
        'SSdtIGtpbGxpbmcgeW91ciBicmFpbiBsaWtlIGEgcG9pc29ub3VzIG11c2hyb29t',
    ),
    (
        '24e1f218372064987d5457b639819715bddb51558cc4acb3ce6eeacd7afa2751bac0a5c7c3c636f24babff4ad68473db',
        'JOHyGDcgZJh9VFe2OYGXFb3bUVWMxKyzzm7qzXr6J1G6wKXHw8Y28kur/0rWhHPb',
    ),
    (
        '79d6e3a9d5bfba9902274e1b1c2d956fa92d16ba9a972825eb0b32aecd2401653624f900fe79b4550c24aae136ae7260',
        'edbjqdW/upkCJ04bHC2Vb6ktFrqalygl6wsyrs0kAWU2JPkA/nm0VQwkquE2rnJg',
    ),
    (
        'd251b89c473d6336dfeb3714d92c6b2080c863624ca2746e1380bd0642893ba64ebdae23bb7ad9a1f3ad9efbdc2f18e6',
        '0lG4nEc9Yzbf6zcU2SxrIIDIY2JMonRuE4C9BkKJO6ZOva4ju3rZofOtnvvcLxjm',
    ),
    (
        '5c2b578064178ad329f37041b063ec05c3ce8f202bb44e9a1260c6ded11ddd91d25ac83bba31bac7987e2da3a188c23d',
        'XCtXgGQXitMp83BBsGPsBcPOjyArtE6aEmDG3tEd3ZHSWsg7ujG6x5h+LaOhiMI9',
    ),
    (
        '018b79f5c3c1a4f59d12cda25c5ca2a29c4c1fdd1cfdf3f0a4faf350fe384d21bcfd83a8350b49231cf8536595f2a43a',
        'AYt59cPBpPWdEs2iXFyiopxMH90c/fPwpPrzUP44TSG8/YOoNQtJIxz4U2WV8qQ6',
    ),
    (
        'a617cfbe469cecd19f5ac75303a3049319ffb03d9a757c690d7c09d94dbabd6dce2314e1f409e6285fc0a0220eb803fe',
        'phfPvkac7NGfWsdTA6MEkxn/sD2adXxpDXwJ2U26vW3OIxTh9AnmKF/AoCIOuAP+',
    ),
    (
        '2bc40041dbe6937e1113b191fd136bcdd741169e9e81809e83ad3104d447d700ed9d1ab5cfbc113c0731b855fde98f87',
        'K8QAQdvmk34RE7GR/RNrzddBFp6egYCeg60xBNRH1wDtnRq1z7wRPAcxuFX96Y+H',
    ),
    (
        '1904435f5964861c5284b08e0ebf3d201da3ec795a3d9b0f7d5056c4369daed59d42cac72c897356a46305f7aac5fcb4',
        'GQRDX1lkhhxShLCODr89IB2j7HlaPZsPfVBWxDadrtWdQsrHLIlzVqRjBfeqxfy0',
    ),
]

for i, (input_str, expected_output) in enumerate(sample_data):
    print('i              ', i)
    print('input_str      ', input_str)
    print('expected_output', expected_output)

    function_output = base64_v2(input_str, 16)
    print('function_output', function_output)
    assert expected_output == function_output
...