Попытка понять сложное использование макросов, шаблонов и перечислений в C ++ 11 - PullRequest
1 голос
/ 14 декабря 2011

Я только что посмотрел это видео http://www.youtube.com/watch?v=y71lli8MS8s и нашел его потрясающим. Вопрос о его матричной функции декодирования кода операции:

template<u16 op> // Execute a single CPU instruction, defined by opcode "op".
void Ins()       // With template magic, the compiler will literally synthesize >256 different functions.
{
    // Note: op 0x100 means "NMI", 0x101 means "Reset", 0x102 means "IRQ". They are implemented in terms of "BRK".
    // User is responsible for ensuring that WB() will not store into memory while Reset is being processed.
    unsigned addr=0, d=0, t=0xFF, c=0, sb=0, pbits = op<0x100 ? 0x30 : 0x20;

    // Define the opcode decoding matrix, which decides which micro-operations constitute
    // any particular opcode. (Note: The PLA of 6502 works on a slightly different principle.)
    enum { o8 = op/8, o8m = 1 << (op%8) };
    // Fetch op'th item from a bitstring encoded in a data-specific variant of base64,
    // where each character transmits 8 bits of information rather than 6.
    // This peculiar encoding was chosen to reduce the source code size.
    // Enum temporaries are used in order to ensure compile-time evaluation.
    #define t(s,code) { enum { \
        i=o8m & (s[o8]>90 ? (130+" (),-089<>?BCFGHJLSVWZ[^hlmnxy|}"[s[o8]-94]) \
                          : (s[o8]-" (("[s[o8]/39])) }; if(i) { code; } }

    /* Decode address operand */
    t("                                !", addr = 0xFFFA) // NMI vector location
    t("                                *", addr = 0xFFFC) // Reset vector location
    t("!                               ,", addr = 0xFFFE) // Interrupt vector location
    t("zy}z{y}zzy}zzy}zzy}zzy}zzy}zzy}z ", addr = RB(PC++))
    t("2 yy2 yy2 yy2 yy2 XX2 XX2 yy2 yy ", d = X) // register index
    t("  62  62  62  62  om  om  62  62 ", d = Y)
    t("2 y 2 y 2 y 2 y 2 y 2 y 2 y 2 y  ", addr=u8(addr+d); d=0; tick())              // add zeropage-index
    t(" y z!y z y z y z y z y z y z y z ", addr=u8(addr);   addr+=256*RB(PC++))       // absolute address
    t("3 6 2 6 2 6 286 2 6 2 6 2 6 2 6 /", addr=RB(c=addr); addr+=256*RB(wrap(c,c+1)))// indirect w/ page wrap
    t("  *Z  *Z  *Z  *Z      6z  *Z  *Z ", Misfire(addr, addr+d)) // abs. load: extra misread when cross-page
    t("  4k  4k  4k  4k  6z      4k  4k ", RB(wrap(addr, addr+d)))// abs. store: always issue a misread
    /* Load source operand */
    t("aa__ff__ab__,4  ____ -  ____     ", t &= A) // Many operations take A or X as operand. Some try in
    t("                knnn     4  99   ", t &= X) // error to take both; the outcome is an AND operation.
    t("                9989    99       ", t &= Y) // sty,dey,iny,tya,cpy
    t("                       4         ", t &= S) // tsx, las
    t("!!!!  !!  !!  !!  !   !!  !!  !!/", t &= P.raw|pbits; c = t)// php, flag test/set/clear, interrupts
    t("_^__dc___^__            ed__98   ", c = t; t = 0xFF)        // save as second operand
    t("vuwvzywvvuwvvuwv    zy|zzywvzywv ", t &= RB(addr+d)) // memory operand
    t(",2  ,2  ,2  ,2  -2  -2  -2  -2   ", t &= RB(PC++))   // immediate operand
    /* Operations that mogrify memory operands directly */
    t("    88                           ", P.V = t & 0x40; P.N = t & 0x80) // bit
    t("    nink    nnnk                 ", sb = P.C)       // rol,rla, ror,rra,arr
    t("nnnknnnk     0                   ", P.C = t & 0x80) // rol,rla, asl,slo,[arr,anc]
    t("        nnnknink                 ", P.C = t & 0x01) // lsr,sre, ror,rra,asr
    t("ninknink                         ", t = (t << 1) | (sb * 0x01))
    t("        nnnknnnk                 ", t = (t >> 1) | (sb * 0x80))
    t("                 !      kink     ", t = u8(t - 1))  // dec,dex,dey,dcp
    t("                         !  khnk ", t = u8(t + 1))  // inc,inx,iny,isb
    /* Store modified value (memory) */
    t("kgnkkgnkkgnkkgnkzy|J    kgnkkgnk ", WB(addr+d, t))
    t("                   q             ", WB(wrap(addr, addr+d), t &= ((addr+d) >> 8))) // [shx,shy,shs,sha?]
    /* Some operations used up one clock cycle that we did not account for yet */
    t("rpstljstqjstrjst - - - -kjstkjst/", tick()) // nop,flag ops,inc,dec,shifts,stack,transregister,interrupts
    /* Stack operations and unconditional jumps */
    t("     !  !    !                   ", tick(); t = Pop())                        // pla,plp,rti
    t("        !   !                    ", RB(PC++); PC = Pop(); PC |= (Pop() << 8)) // rti,rts
    t("            !                    ", RB(PC++))  // rts
    t("!   !                           /", d=PC+(op?-1:1); Push(d>>8); Push(d))      // jsr, interrupts
    t("!   !    8   8                  /", PC = addr) // jmp, jsr, interrupts
    t("!!       !                      /", Push(t))   // pha, php, interrupts
    /* Bitmasks */
    t("! !!  !!  !!  !!  !   !!  !!  !!/", t = 1)
    t("  !   !                   !!  !! ", t <<= 1)
    t("! !   !   !!  !!       !   !   !/", t <<= 2)
    t("  !   !   !   !        !         ", t <<= 4)
    t("   !       !           !   !____ ", t = u8(~t)) // sbc, isb,      clear flag
    t("`^__   !       !               !/", t = c | t)  // ora, slo,      set flag
    t("  !!dc`_  !!  !   !   !!  !!  !  ", t = c & t)  // and, bit, rla, clear/test flag
    t("        _^__                     ", t = c ^ t)  // eor, sre
    /* Conditional branches */
    t("      !       !       !       !  ", if(t)  { tick(); Misfire(PC, addr = s8(addr) + PC); PC=addr; })
    t("  !       !       !       !      ", if(!t) { tick(); Misfire(PC, addr = s8(addr) + PC); PC=addr; })
    /* Addition and subtraction */
    t("            _^__            ____ ", c = t; t += A + P.C; P.V = (c^t) & (A^t) & 0x80; P.C = t & 0x100)
    t("                        ed__98   ", t = c - t; P.C = ~t & 0x100) // cmp,cpx,cpy, dcp, sbx
    /* Store modified value (register) */
    t("aa__aa__aa__ab__ 4 !____    ____ ", A = t)
    t("                    nnnn 4   !   ", X = t) // ldx, dex, tax, inx, tsx,lax,las,sbx
    t("                 !  9988 !       ", Y = t) // ldy, dey, tay, iny
    t("                   4   0         ", S = t) // txs, las, shs
    t("!  ! ! !!  !   !       !   !   !/", P.raw = t & ~0x30) // plp, rti, flag set/clear
    /* Generic status flag updates */
    t("wwwvwwwvwwwvwxwv 5 !}}||{}wv{{wv ", P.N = t & 0x80)
    t("wwwv||wvwwwvwxwv 5 !}}||{}wv{{wv ", P.Z = u8(t) == 0)
    t("             0                   ", P.V = (((t >> 5)+1)&2))         // [arr]
    /* All implemented opcodes are cycle-accurate and memory-access-accurate.
     * [] means that this particular separate rule exists only to provide the indicated unofficial opcode(s).
     */
}

Что меня очень смущает, так это определение определения. Когда макросы раскрываются, это выглядит так: http://codepad.org/bUxdX8MQ. Но как '130+" (),-089<>?BCFGHJLSVWZ[^hlmnxy|}"' может быть допустимым кодом C ++? Насколько я знаю, объединение строк и целых чисел таким образом незаконно. Также это ("zy}z{y}zzy}zzy}zzy}zzy}zzy}zzy}z "[o8]>90) вообще не имеет смысла, если только в C ++ 11 не добавлена ​​поддержка доступа к символам строки в виде массива. Надеюсь узнать что-то новое!

РЕДАКТИРОВАТЬ: Спасибо всем, кто ответил. Я не знал, что "blabla"[idx] было разрешено в C / C ++ теперь, когда я делаю код, имеет смысл.

Ответы [ 3 ]

1 голос
/ 14 декабря 2011

Строковые литералы - это просто char массивы, а символы - это просто 8-битные целые числа, поэтому выполнять арифметику с ними совершенно законно. Их также можно повысить до int автоматически.

Итак, чтобы взять одну строку и разбить ее:

{ enum { i=                                                    //1

все, что находится справа от =, должно быть целой константой

           o8m &                                               //2

o8m = 1 << (op%8), определенный выше; поэтому мы знаем 0 <= 08m < 8. Мы побитовые - и это с чем-то, так что снова RHS будет интегральной константой

                 ("                                !"[o8]>90 ? //3

если o8-й символ в этом строковом литерале имеет целочисленное значение > 90, то ...

(130+                                                          //4

... тогда результат (будет and ed с 08m выше) будет 130 плюс что-то ...

" (),-089<>?BCFGHJLSVWZ[^hlmnxy|}"[                            //5

... снова мы берем символ из этого строкового литерала, вычисляя индекс как:

"                                !"[o8]-94])                   //6

... o8 -й символ этого другого строкового литерала, меньше 94. Я не уверен, что это будет правильно, поскольку ни один из символов в этом строковом литерале не имеет значения >= 94, и отрицательный ответ будет недопустимым индексом для выражения 5 .

В любом случае, это завершает выражение 4 , которое является первой ветвью троичного выражения 3 . Теперь о другом ...

: ("                                !"[o8]-                    //7
   " (("[                                                      //8
     "                                !"[o8]/39                //9
   ]
  )

Теперь 9 - это целое значение, которое дает индекс в 8 ; символ с этим индексом вычитается из 7 , чтобы получить окончательное значение ветви else .

) };
if(i) { addr = 0xFFFA; } }

Итак, мы наконец закончили кропотливо вычислять постоянное значение i. Если это ненулевое значение, установите addr.

ОК, это было ужасно, и я пропускаю поиск скобок в браузере, но, надеюсь, вы поняли идею.

1 голос
/ 14 декабря 2011

Строка - это массив, поэтому "hello"[ 1 ] == 'e'.Кроме того, массив распадается на указатель на свой первый элемент, и операция подписки определяется как array[ index ] == * ( array + index ).Добавление создает указатель после первого элемента.

Выражение в #define сбивает с толку, поскольку оно опирается на правила приоритета, а не на круглые скобки, и делает это в забавном порядке.На самом деле это не пример хорошего кода.

Нет необходимости заставлять компилятор что-то оценивать во время компиляции.Все константные выражения во время компиляции будут оптимизированы как таковые, когда оптимизация включена, в противном случае вы можете захотеть выполнить оценку в отладчике!Итак, вот переформатированная версия:

if ( ( op % 8 ) & // low 3 bits select conditions for execution
     ( s[ op / 8 ] > 'Z'? // lowercase letters go through complicated mapping
       ( " (),-089<>?BCFGHJLSVWZ[^hlmnxy|}"[ s[ op / 8 ] - 'Z' - 4 ] ) + 130
     : s[ op / 8 ] - " (("[ s [ op / 8 ] / 39 ] ) ) { // uppercase is simpler
    code;
}

Это все еще довольно запутанно и, вероятно, неэффективно.Я не могу сказать, почему автор так поступает (не смотрел YouTube), но поскольку op8 = op % 8 генерирует младшие три бита, то есть число в диапазоне 0,7, кажется, что делать что-то подобное бессмысленнокак добавить 130, прежде чем снова извлечь подмножество младших трех битов (на этот раз с оператором &).

В любом случае…

Это вычисляет индекс в строке аргумента макроса:

[ s[ op / 8 ] - 'Z' - 4 ]

Это отображает заглавные буквы в строке аргумента макроса на другие буквы ... не спрашивайте меня, почему.Выглядит как свидетельство ошибочного дизайна;на этом уровне строка должна иметь формат без необходимости перевода.

( " (),-089<>?BCFGHJLSVWZ[^hlmnxy|}"[ s[ op / 8 ] - 'Z' - 4 ] )

Наконец, добавляется число 130.Так как 130 % 8 == 2, я думаю, что 2 также будет работать.Бьет меняКроме того, выполнение сложения здесь имеет побочный эффект изменения типа выражения на int, но не имеет значения, находится ли 130 в диапазоне char.

( " (),-089<>?BCFGHJLSVWZ[^hlmnxy|}"[ s[ op / 8 ] - 'Z' - 4 ] ) + 130

Установка двоичного кодаданные в строковые литералы - это любимая стратегия для запутывания, а «Code Golf» - как можно более короткая программа.Это способ сделать программу нечитаемой и достаточно компактной в памяти, , а не способ сделать ее быстрее, и не лучший способ оптимизировать потребление памяти.Если вы хотите таблицу чисел, укажите их как числа в шестнадцатеричном или десятичном виде.

1 голос
/ 14 декабря 2011

На самом деле это должно быть

130+" (),-089<>?BCFGHJLSVWZ[^hlmnxy|}"["                                !"[o8]-94]

Строковый литерал DOES имеет тип array of char из первой спецификации C ++.

Таким образом, вышеприведенное можно переписать как:

char s1[]=" (),-089<>?BCFGHJLSVWZ[^hlmnxy|}";
char s2[]="                                !";
130+s1[s2[o8]-94];

Вы можете видеть, что это законно C ++.

...