Что подразумевается под неизменным? - PullRequest
372 голосов
/ 11 ноября 2008

Это может быть самый тупой вопрос, который когда-либо задавался, но я думаю, что это довольно запутанно для новичка в Java.

  1. Может кто-нибудь уточнить, что подразумевается под неизменным ?
  2. Почему String неизменный?
  3. Каковы преимущества / недостатки неизменяемых объектов?
  4. Почему изменяемый объект, такой как StringBuilder, должен быть предпочтительнее, чем String и наоборот?

Хороший пример (на Java) будет очень полезен.

Ответы [ 17 ]

255 голосов
/ 11 ноября 2008

Неизменяемый означает, что, как только конструктор для объекта завершит выполнение, этот экземпляр не может быть изменен.

Это полезно, поскольку это означает, что вы можете передавать ссылки на объект вокруг, не беспокоясь о том, что кто-то другой изменит его содержимое. Особенно при работе с параллелизмом нет проблем с блокировкой объектов, которые никогда не меняются

, например

class Foo
{
     private final String myvar;

     public Foo(final String initialValue)
     {
         this.myvar = initialValue;
     }

     public String getValue()
     {
         return this.myvar;
     }
}

Foo не нужно беспокоиться, что вызывающий абонент на getValue() может изменить текст в строке.

Если вы представляете класс, аналогичный Foo, но с StringBuilder вместо String в качестве члена, вы можете видеть, что вызывающая сторона к getValue() сможет изменить атрибут StringBuilder Foo экземпляра.

Также остерегайтесь различных видов неизменности, которые вы можете найти: Эрик Липперт написал статью в блоге об этом. По сути, у вас могут быть объекты, чей интерфейс является неизменным, но за кулисами фактически скрытое состояние изменяемых файлов (и, следовательно, его нельзя безопасно разделить между потоками).

79 голосов
/ 10 августа 2009

Неизменяемый объект - это объект, в котором внутренние поля (или, по крайней мере, все внутренние поля, влияющие на его внешнее поведение) не могут быть изменены.

Есть много преимуществ для неизменяемых строк:

Производительность: Выполните следующую операцию:

String substring = fullstring.substring(x,y);

Базовый C для метода substring (), вероятно, выглядит примерно так:

// Assume string is stored like this:
struct String { char* characters; unsigned int length; };

// Passing pointers because Java is pass-by-reference
struct String* substring(struct String* in, unsigned int begin, unsigned int end)
{
    struct String* out = malloc(sizeof(struct String));
    out->characters = in->characters + begin;
    out->length = end - begin;
    return out;
}

Обратите внимание, что ни один из символов не должен быть скопирован! Если бы объект String был изменяемым (символы могли измениться позже), вам пришлось бы скопировать все символы, в противном случае изменились бы символы в подстроке будет отражено в другой строке позже.

Параллельность: Если внутренняя структура неизменяемого объекта действительна, она всегда будет действительной. Нет никаких шансов, что разные потоки могут создать недопустимое состояние в этом объекте. Следовательно, неизменяемыми объектами являются Thread Safe .

Сборка мусора: Сборщику мусора гораздо проще принимать логические решения относительно неизменных объектов.

Однако есть и недостатки неизменности:

Производительность: Подожди, я думал, ты сказал, что производительность была непревзойденной! Ну, иногда, но не всегда. Возьмите следующий код:

foo = foo.substring(0,4) + "a" + foo.substring(5);  // foo is a String
bar.replace(4,5,"a"); // bar is a StringBuilder

Обе строки заменяют четвертый символ буквой «а». Второй фрагмент кода не только более читабелен, но и быстрее. Посмотрите, как вы должны сделать основной код для foo. Подстроки просты, но теперь, когда в пятой позиции уже есть символ и что-то еще может ссылаться на foo, вы не можете просто изменить его; Вы должны скопировать всю строку (конечно, некоторые из этих функций абстрагированы в функции в реальном базовом C, но суть здесь в том, чтобы показать код, который выполняется все в одном месте).

struct String* concatenate(struct String* first, struct String* second)
{
    struct String* new = malloc(sizeof(struct String));
    new->length = first->length + second->length;

    new->characters = malloc(new->length);

    int i;

    for(i = 0; i < first->length; i++)
        new->characters[i] = first->characters[i];

    for(; i - first->length < second->length; i++)
        new->characters[i] = second->characters[i - first->length];

    return new;
}

// The code that executes
struct String* astring;
char a = 'a';
astring->characters = &a;
astring->length = 1;
foo = concatenate(concatenate(slice(foo,0,4),astring),slice(foo,5,foo->length));

Обратите внимание, что concatenate вызывается дважды , что означает, что вся строка должна быть зациклена! Сравните это с кодом C для операции bar:

bar->characters[4] = 'a';

Операция с изменяемой строкой, очевидно, намного быстрее.

В заключение: В большинстве случаев вам нужна неизменная строка. Но если вам нужно много добавлять и вставлять в строку, вам нужна изменчивость для скорости. Если вам нужны преимущества параллелизма, обеспечивающие безопасность и сборку мусора, необходимо сохранить локально изменяемые объекты для метода:

// This will have awful performance if you don't use mutable strings
String join(String[] strings, String separator)
{
    StringBuilder mutable;
    boolean first = true;

    for(int i = 0; i < strings.length; i++)
    {
        if(!first) first = false;
        else mutable.append(separator);

        mutable.append(strings[i]);
    }

    return mutable.toString();
}

Поскольку объект mutable является локальной ссылкой, вам не нужно беспокоиться о безопасности параллелизма (только один поток когда-либо касается его). А поскольку на него больше нигде нет ссылок, он размещается только в стеке, поэтому он освобождается, как только завершается вызов функции (вам не нужно беспокоиться о сборке мусора). И вы получаете все преимущества производительности как изменчивости, так и неизменности.

30 голосов
/ 04 февраля 2009

На самом деле строка не является неизменной, если вы используете определение Википедии, предложенное выше.

Состояние строки меняет пост-конструкцию. Взгляните на метод hashcode (). String кэширует значение хеш-кода в локальном поле, но не вычисляет его до первого вызова hashcode (). Эта ленивая оценка хеш-кода ставит String в интересное положение как неизменного объекта, состояние которого изменяется, но нельзя наблюдать, как он изменился без использования отражения.

Так что, возможно, определение неизменного должно быть объектом, который, как нельзя наблюдать, изменился.

Если состояние изменяется в неизменяемом объекте после того, как он был создан, но никто не может видеть его (без отражения), остается ли объект неизменным?

24 голосов
/ 11 ноября 2008

Неизменяемые объекты - это объекты, которые нельзя изменить программно. Они особенно хороши для многопоточных сред или других сред, в которых более одного процесса могут изменять (изменять) значения в объекте.

Просто для пояснения, однако, StringBuilder на самом деле является изменяемым объектом, а не неизменным. Обычная строка Java является неизменной (это означает, что после ее создания вы не можете изменить базовую строку без изменения объекта).

Например, допустим, у меня есть класс ColoredString, который имеет значение String и цвет String:

public class ColoredString {

    private String color;
    private String string;

    public ColoredString(String color, String string) {
        this.color  = color;
        this.string = string;
    }

    public String getColor()  { return this.color;  }
    public String getString() { return this.string; }

    public void setColor(String newColor) {
        this.color = newColor;
    }

}

В этом примере ColoredString называется изменяемой, поскольку вы можете изменить (изменить) одно из его ключевых свойств, не создавая новый класс ColoredString. Причина, по которой это может быть плохо, например, допустим, у вас есть приложение с графическим интерфейсом, которое имеет несколько потоков, и вы используете ColoredStrings для печати данных в окне. Если у вас есть экземпляр ColoredString, который был создан как

new ColoredString("Blue", "This is a blue string!");

Тогда вы ожидаете, что строка всегда будет синей. Если другой поток, однако, получил этот экземпляр и вызвал

blueString.setColor("Red");

Вы бы внезапно, и, вероятно, неожиданно, теперь получили «Красную» строку, если вы хотели «Синюю». Из-за этого неизменные объекты почти всегда предпочтительнее при передаче экземпляров объектов вокруг. Если у вас есть случай, когда изменяемые объекты действительно необходимы, вы, как правило, охраняете объект, только передавая копии из вашей конкретной области управления.

Напомним, что в Java java.lang.String является неизменным объектом (его нельзя изменить после его создания ), а java.lang.StringBuilder является изменяемым объектом, поскольку его можно изменить без создания новый экземпляр.

23 голосов
/ 18 июля 2015
  1. В больших приложениях обычно строковые литералы занимают большие биты памяти. Таким образом, чтобы эффективно обрабатывать память, JVM выделяет область, называемую «Пул константных строк». ( Обратите внимание, что в памяти даже не ссылочная String переносит char [], int для своей длины и другую для своего хэш-кода. Для числа, напротив, требуется максимум восемь непосредственных байтов )
  2. Когда complier сталкивается с литералом String, он проверяет пул, чтобы увидеть, присутствует ли уже идентичный литерал. И если он найден, ссылка на новый литерал направляется на существующую строку, и новый объект-литерал String не создается (существующая строка просто получает дополнительную ссылку).
  3. Следовательно: Изменяемость строк экономит память ...
  4. Но когда любая из переменных меняет значение, на самом деле - изменяется только их ссылка, а не значение в памяти (следовательно, оно не повлияет на другие переменные, ссылающиеся на него), как показано ниже ....

String s1 = "Старая строка";

//s1 variable, refers to string in memory
        reference                 |     MEMORY       |
        variables                 |                  |

           [s1]   --------------->|   "Old String"   |

Строка s2 = s1;

//s2 refers to same string as s1
                                  |                  |
           [s1]   --------------->|   "Old String"   |
           [s2]   ------------------------^

s1 = "Новая строка";

//s1 deletes reference to old string and points to the newly created one
           [s1]   -----|--------->|   "New String"   |
                       |          |                  |
                       |~~~~~~~~~X|   "Old String"   |
           [s2]   ------------------------^

Исходная строка «в памяти» не изменилась, но ссылочная переменная была изменена так, чтобы она ссылалась на новую строку. И если бы у нас не было s2, «Старая строка» все равно была бы в памяти, но мы не сможем получить к нему доступ ...

16 голосов
/ 11 ноября 2008

«неизменный» означает, что вы не можете изменить значение. Если у вас есть экземпляр класса String, любой вызываемый вами метод, который, по-видимому, изменяет значение, фактически создаст другую строку.

String foo = "Hello";
foo.substring(3);
<-- foo here still has the same value "Hello"

Чтобы сохранить изменения, вы должны сделать что-то вроде этого foo = foo.sustring (3);

Неизменность и изменчивость могут быть смешными, когда вы работаете с коллекциями. Подумайте, что произойдет, если вы используете изменяемый объект в качестве ключа для карты, а затем измените значение (совет: подумайте о equals и hashCode).

10 голосов
/ 12 июня 2016

java.time

Возможно, будет немного поздно, но чтобы понять, что такое неизменный объект, рассмотрим следующий пример из нового API даты и времени Java 8 ( java.time ). Как вы, наверное, знаете, все объекты даты из Java 8 неизменны , поэтому в следующем примере

LocalDate date = LocalDate.of(2014, 3, 18); 
date.plusYears(2);
System.out.println(date);

Выход:

2014-03-18

Это печатает тот же год, что и начальная дата, потому что plusYears(2) возвращает новый объект, поэтому старая дата остается неизменной, потому что это неизменный объект. После создания вы не можете его изменить, а переменная даты все еще указывает на него.

Итак, этот пример кода должен захватывать и использовать новый объект, созданный и возвращенный этим вызовом в plusYears.

LocalDate date = LocalDate.of(2014, 3, 18); 
LocalDate dateAfterTwoYears = date.plusYears(2);

date.toString ()… 2014-03-18

dateAfterTwoYears.toString ()… 2016-03-18

8 голосов
/ 11 ноября 2008

Мне очень нравится объяснение из SCJP Sun Certified Programmer для Java 5 Учебное пособие .

Чтобы повысить эффективность использования памяти Java, JVM выделяет специальную область памяти, которая называется «Пул константных строк». Когда компилятор встречает литерал String, он проверяет пул, чтобы увидеть, существует ли уже идентичная строка. Если совпадение найдено, ссылка на новый литерал направляется на существующую строку, и новый объект литерала строки не создается.

8 голосов
/ 11 ноября 2008

Неизменяемые объекты не могут изменять свое состояние после создания.

Существует три основных причины использования неизменяемых объектов, когда это возможно, все из которых помогут уменьшить количество ошибок, которые вы вводите в свой код:

  • Гораздо проще рассуждать о том, как работает ваша программа, когда вы знаете, что состояние объекта не может быть изменено другим методом
  • Неизменяемые объекты автоматически поточнобезопасны (при условии, что они опубликованы безопасно), поэтому никогда не будут причиной этих трудных для обнаружения ошибок многопоточности
  • Неизменяемые объекты всегда будут иметь один и тот же хэш-код, поэтому их можно использовать в качестве ключей в HashMap (или аналогичных). Если хеш-код элемента в хеш-таблице должен был измениться, запись в таблице будет фактически потеряна, так как попытки найти его в таблице приведут к тому, что он будет искать не в том месте. Это основная причина того, что объекты String являются неизменяемыми - они часто используются в качестве ключей HashMap.

Существуют также некоторые другие оптимизации, которые вы можете выполнить в коде, когда знаете, что состояние объекта является неизменным - например, кеширование вычисленного хэша - но это оптимизация и, следовательно, не столь интересная.

5 голосов
/ 11 ноября 2008

Одно значение имеет отношение к тому, как значение хранится в компьютере. Например, для строки .Net это означает, что строку в памяти нельзя изменить. Когда вы думаете, что изменяете ее, вы на самом деле создание новой строки в памяти и указание существующей переменной (которая является просто указателем на фактическую коллекцию символов где-то еще) на новую строку.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...