Java: если против Switch - PullRequest
17 голосов
/ 30 июня 2009

У меня есть фрагмент кода с а), который я заменил на б) исключительно для разборчивости ...

а)

if ( WORD[ INDEX ] == 'A' ) branch = BRANCH.A;
/* B through to Y */
if ( WORD[ INDEX ] == 'Z' ) branch = BRANCH.Z;

б)

switch ( WORD[ INDEX ] ) {
    case 'A' : branch = BRANCH.A; break;
    /* B through to Y */
    case 'Z' : branch = BRANCH.Z; break;
}


... будет ли версия коммутатора каскадно проходить через все перестановки или переходить к регистру?



РЕДАКТИРОВАТЬ:

Некоторые ответы ниже касаются альтернативных подходов к подходу выше.
Я включил следующее, чтобы предоставить контекст для его использования.

Причина, по которой я задал этот вопрос, была в том, что скорость добавления слов эмпирически улучшилась.

Это никоим образом не рабочий код, и он был быстро взломан как PoC.

Следующее, кажется, подтверждение неудачи для мысленного эксперимента.
Мне может понадобиться гораздо больший набор слов, чем тот, который я сейчас использую.
Ошибка возникает из-за того, что я не учел нулевые ссылки, все еще требующие памяти. (doh!)

public class Dictionary {
    private static Dictionary ROOT;
    private boolean terminus;
    private Dictionary A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z;
    private static Dictionary instantiate( final Dictionary DICTIONARY ) {
        return ( DICTIONARY == null ) ? new Dictionary() : DICTIONARY;
    }
    private Dictionary() {
        this.terminus = false;
        this.A = this.B = this.C = this.D = this.E = this.F = this.G = this.H = this.I = this.J = this.K = this.L = this.M = this.N = this.O = this.P = this.Q = this.R = this.S = this.T = this.U = this.V = this.W = this.X = this.Y = this.Z = null;
    }
    public static void add( final String...STRINGS ) {
        Dictionary.ROOT = Dictionary.instantiate( Dictionary.ROOT );
        for ( final String STRING : STRINGS ) Dictionary.add( STRING.toUpperCase().toCharArray(), Dictionary.ROOT , 0, STRING.length() - 1 );
    }
    private static void add( final char[] WORD, final Dictionary BRANCH, final int INDEX, final int INDEX_LIMIT ) {
        Dictionary branch = null;
        switch ( WORD[ INDEX ] ) {
        case 'A' : branch = BRANCH.A = Dictionary.instantiate( BRANCH.A ); break;
        case 'B' : branch = BRANCH.B = Dictionary.instantiate( BRANCH.B ); break;
        case 'C' : branch = BRANCH.C = Dictionary.instantiate( BRANCH.C ); break;
        case 'D' : branch = BRANCH.D = Dictionary.instantiate( BRANCH.D ); break;
        case 'E' : branch = BRANCH.E = Dictionary.instantiate( BRANCH.E ); break;
        case 'F' : branch = BRANCH.F = Dictionary.instantiate( BRANCH.F ); break;
        case 'G' : branch = BRANCH.G = Dictionary.instantiate( BRANCH.G ); break;
        case 'H' : branch = BRANCH.H = Dictionary.instantiate( BRANCH.H ); break;
        case 'I' : branch = BRANCH.I = Dictionary.instantiate( BRANCH.I ); break;
        case 'J' : branch = BRANCH.J = Dictionary.instantiate( BRANCH.J ); break;
        case 'K' : branch = BRANCH.K = Dictionary.instantiate( BRANCH.K ); break;
        case 'L' : branch = BRANCH.L = Dictionary.instantiate( BRANCH.L ); break;
        case 'M' : branch = BRANCH.M = Dictionary.instantiate( BRANCH.M ); break;
        case 'N' : branch = BRANCH.N = Dictionary.instantiate( BRANCH.N ); break;
        case 'O' : branch = BRANCH.O = Dictionary.instantiate( BRANCH.O ); break;
        case 'P' : branch = BRANCH.P = Dictionary.instantiate( BRANCH.P ); break;
        case 'Q' : branch = BRANCH.Q = Dictionary.instantiate( BRANCH.Q ); break;
        case 'R' : branch = BRANCH.R = Dictionary.instantiate( BRANCH.R ); break;
        case 'S' : branch = BRANCH.S = Dictionary.instantiate( BRANCH.S ); break;
        case 'T' : branch = BRANCH.T = Dictionary.instantiate( BRANCH.T ); break;
        case 'U' : branch = BRANCH.U = Dictionary.instantiate( BRANCH.U ); break;
        case 'V' : branch = BRANCH.V = Dictionary.instantiate( BRANCH.V ); break;
        case 'W' : branch = BRANCH.W = Dictionary.instantiate( BRANCH.W ); break;
        case 'X' : branch = BRANCH.X = Dictionary.instantiate( BRANCH.X ); break;
        case 'Y' : branch = BRANCH.Y = Dictionary.instantiate( BRANCH.Y ); break;
        case 'Z' : branch = BRANCH.Z = Dictionary.instantiate( BRANCH.Z ); break;
        }   
        if ( INDEX == INDEX_LIMIT ) branch.terminus = true;
        else Dictionary.add( WORD, branch, INDEX + 1, INDEX_LIMIT );
    }
    public static boolean is( final String STRING ) {
        Dictionary.ROOT = Dictionary.instantiate( Dictionary.ROOT );
        return Dictionary.is( STRING.toUpperCase().toCharArray(), Dictionary.ROOT, 0, STRING.length() - 1 );
    }
    private static boolean is( final char[] WORD, final Dictionary BRANCH, final int INDEX, final int INDEX_LIMIT ) {
        Dictionary branch = null;
        switch ( WORD[ INDEX ] ) {
        case 'A' : branch = BRANCH.A; break;
        case 'B' : branch = BRANCH.B; break;
        case 'C' : branch = BRANCH.C; break;
        case 'D' : branch = BRANCH.D; break;
        case 'E' : branch = BRANCH.E; break;
        case 'F' : branch = BRANCH.F; break;
        case 'G' : branch = BRANCH.G; break;
        case 'H' : branch = BRANCH.H; break;
        case 'I' : branch = BRANCH.I; break;
        case 'J' : branch = BRANCH.J; break;
        case 'K' : branch = BRANCH.K; break;
        case 'L' : branch = BRANCH.L; break;
        case 'M' : branch = BRANCH.M; break;
        case 'N' : branch = BRANCH.N; break;
        case 'O' : branch = BRANCH.O; break;
        case 'P' : branch = BRANCH.P; break;
        case 'Q' : branch = BRANCH.Q; break;
        case 'R' : branch = BRANCH.R; break;
        case 'S' : branch = BRANCH.S; break;
        case 'T' : branch = BRANCH.T; break;
        case 'U' : branch = BRANCH.U; break;
        case 'V' : branch = BRANCH.V; break;
        case 'W' : branch = BRANCH.W; break;
        case 'X' : branch = BRANCH.X; break;
        case 'Y' : branch = BRANCH.Y; break;
        case 'Z' : branch = BRANCH.Z; break;
        }
        if ( branch == null ) return false;
        if ( INDEX == INDEX_LIMIT ) return branch.terminus;
        else return Dictionary.is( WORD, branch, INDEX + 1, INDEX_LIMIT );
    }
}

Ответы [ 11 ]

24 голосов
/ 30 июня 2009

Не беспокойтесь о производительности; используйте синтаксис, который лучше всего выражает то, что вы делаете. Только после того, как вы (а) продемонстрировали недостаток производительности; и (б) локализовать его для рассматриваемой процедуры, только тогда вы должны беспокоиться о производительности. За мои деньги синтаксис регистра здесь более уместен.

21 голосов
/ 30 июня 2009

В байт-коде есть две формы переключения: tableswitch и lookupswitch. Один предполагает плотный набор ключей, другой редкий. См. Описание параметра компиляции в спецификации JVM . Для перечислений найден порядковый номер, а затем код продолжается как регистр int. Я не совсем уверен, как будет реализована предложенная switch на String небольшая функция в JDK7.

Однако интенсивно используемый код обычно компилируется в любой разумной JVM. Оптимизатор не совсем тупой. Не беспокойтесь об этом и следуйте обычной эвристике для оптимизации.

7 голосов
/ 30 июня 2009

Похоже, вы перечислили значения, так что, возможно, перечисление в порядке?

enum BRANCH {
  A,B, ... Y,Z;
}

Тогда в вашем коде:

BRANCH branch = BRANCH.valueOf( WORD[ INDEX ] );

Кроме того, в вашем коде возможна ошибка, из-за которой "A" == "A" может быть ложным в зависимости от идентификатора объекта "A".

4 голосов
/ 30 июня 2009

Не совсем ответ на ваш вопрос, но на самом деле в вашем коде есть ошибка, вы должны делать перерыв после каждого случая:

switch ( WORD[ INDEX ] ) {
    case 'A' : branch = BRANCH.A; break;
    /* B through to Y */
    case 'Z' : branch = BRANCH.Z; break;
}

Я не думаю, что различия в производительности будут здесь слишком значительными, но если вы действительно заботитесь о производительности и если этот код выполняется очень часто, вот еще один вариант:

// Warning, untested code.
BRANCH[] branchLookUp = {BRANCH.A, BRANCH.B, ..., BRANCH.Z};

branch = branchLookUp[WORD[INDEX] - 'A'];

Обязательно инкапсулируйте это и хорошо документируйте, хотя.

3 голосов
/ 30 июня 2009

Вот способ избежать всех операторов case.

import java.util.HashMap;

public class Dictionary {
    private static Dictionary                       ROOT;
    private boolean                                 terminus;
    private final HashMap<Character, Dictionary>    dictionaries    = new HashMap<Character, Dictionary>();

    private void ensureBranch(char c) {
        if (getBranch(c) != null)
            return;
        dictionaries.put(c, new Dictionary());
    }

    private Dictionary getBranch(char c) {
        return dictionaries.get(c);
    }

    public static boolean is(final String string) {
        ensureRoot();
        return is(chars(string), ROOT, 0, string.length() - 1);
    }

    public static void add(final String... strings) {
        ensureRoot();
        for (final String string : strings)
            add(chars(string), ROOT, 0, string.length() - 1);
    }

    private static void ensureRoot() {
        if (ROOT == null)
            ROOT = new Dictionary();
    }

    private static char[] chars(final String string) {
        return string.toUpperCase().toCharArray();
    }

    private Dictionary() {
        this.terminus = false;
    }

    private static void add(final char[] word, final Dictionary dictionary, final int index, final int limit) {
        Dictionary branch = getBranch(word, dictionary, index);
        if (index == limit)
            branch.terminus = true;
        else
            add(word, branch, index + 1, limit);
    }

    private static Dictionary getBranch(final char[] word, final Dictionary dictionary, final int index) {
        final char c = word[index];
        dictionary.ensureBranch(c);
        return dictionary.getBranch(c);
    }

    private static boolean is(final char[] word, final Dictionary dictionary, final int index, final int limit) {
        Dictionary branch = dictionary.getBranch(word[index]);
        if (branch == null)
            return false;
        if (index == limit)
            return branch.terminus;
        return is(word, branch, index + 1, limit);
    }
}
3 голосов
/ 30 июня 2009

Если у вас есть оператор switch с последовательными целочисленными значениями, в зависимости от языка, он может быть оптимизирован для таблицы ветвлений, что очень быстро. Во всяком случае, не медленнее!

Кроме того, использование if / else if будет улучшением по сравнению с if для таких случаев, как этот, в которых ваши случаи являются взаимоисключающими. Нет смысла делать еще 25 проверок после сопоставления A.

Но, по сути, любая разница в производительности незначительна, и вы должны использовать наиболее правильный синтаксис, который в этом случае является оператором switch. Обязательно делите ваши дела с перерывами.

3 голосов
/ 30 июня 2009

Честно говоря, я не думаю, что производительность имеет значение в этом случае. Это действительно зависит от компилятора и его оптимизации.

2 голосов
/ 02 июля 2009

Я знаю, что это совсем не то, о чем вы спрашиваете, но разве вы не просто делаете это?

public class Dictionary {
    private static final Set<String> WORDS = new HashSet<String>();

    public static void add(final String... STRINGS) {
        for (String str : STRINGS) {
            WORDS.add(str.toUpperCase());
        }
    }

    public static boolean is(final String STRING) {
        return WORDS.contains(STRING.toUpperCase());
    }
}

Вы просто ищете что-то немного более эффективное использование памяти?

1 голос
/ 30 июня 2009

switch должен быть логарифмическим, а if - линейным, при условии, что компилятор не может найти ничего умного. Но длинные switch сложно читать, а также подвержены ошибкам - как уже отмечалось, у переключателя, который вы указали выше, нет никаких разрывов, и он будет падать во всех случаях.

Почему бы не заполнить Map вместо этого, а просто использовать Map.get()?

private static final Map<Char, Whatever> BRANCHES = Collections.unmodifiableMap(new HashMap<Char, Whatever>() {{
    put('A', BRANCH.A);
    ...
    put('Z', BRANCH.Z);
}}

public void getBranch(char[] WORD, int INDEX) {
    return BRANCHES.get(WORD[INDEX]);
}

Как отмечено выше, если BRANCH является Enum, это поведение должно быть правильно в Enum.

(Что такое WORD, INDEX и BRANCH здесь, во всяком случае? Из имен они должны быть константами, но вы не можете иметь постоянные массивы - содержимое всегда можно изменить; не было бы большого смысла в создании постоянной "структуры", и, конечно, не было бы особого смысла в iff или переключении, основанном на константах ....

1 голос
/ 30 июня 2009

Оператор switch должен использовать хеш, чтобы выбрать, к какому делу обращаться. Оттуда, каждый последующий случай также будет выполняться, если нет операторов break. Например, с вашим кодом, если вы включите X, он сразу перейдет к X, затем к Y, а затем к Z.

...