Question

Вот этот код:

public class Main {
    public static void main(String[] args) {
      float a = Float.MAX_VALUE;
      double b = (double) a;
      b++;
      System.out.println(b == a);
}

и он печатает true.Кто-нибудь может объяснить, почему?

Eric Postpischil · Answer 1 · 13 июня 2018

Точность double не может представить разницу между Float.MAX_VALUE и Float.MAX_VALUE+1, поэтому возвращается округленный результат.Этот округленный результат равен Float.MAX_VALUE.

Float.MAX_VALUE равен 2 ¹²⁸ -2 ¹⁰⁴.(Обратите внимание, что это 2 ¹²⁷ + 2 ¹²⁶ + 2 ¹²⁵ +… + 2 ¹⁰⁴. То есть это суммавсех степеней двух от 2 ¹²⁷ до 2 ¹⁰⁴. В двоичном коде он имеет 24 бита, что является числом битов в значимом и ¹a float. Математически это равно 2 ¹²⁸ -2 ¹⁰⁴.)

Когда вы добавляете один к этому, математический результат, конечно, 2 ^{* 1034 128 * -2 ¹⁰⁴ + 1.Это не представимо в double, поскольку значение double составляет 53 бита, а от 2 ¹²⁷ до 1 - 129 бит.Вы не можете поместить биты как для 2 ¹²⁷, так и для 1 в значении и double.Когда результат не может быть представлен, возвращается ближайшее представимое число.}

Представляемое число чуть ниже математического результата составляет 2 ¹²⁸ -2 ¹⁰⁴, а представимоечисло чуть выше математического результата составляет 2 ¹²⁸ -2 ¹⁰⁴ + 2 ⁷⁵.(Обратите внимание, что от 2 ¹²⁷ до 2 ⁷⁵ составляет 52 бита, поэтому 2 ⁷⁵ - это наименьшая степень 2, которую биты в 53-битном значении имеют, а гдесамый большой бит масштабируется до 2 ¹²⁷. Таким образом, мы вычислили это следующее число выше 2 ¹²⁸ -2 ¹⁰⁴, добавив к нему наименьшее количество, которое подходитЗначим.) Итак, у нас есть два кандидата:

2 ¹²⁸ -2 ¹⁰⁴, что равно 1 от 2 ¹²⁸−2 ¹⁰⁴ + 1.
2 ¹²⁸ -2 ¹⁰⁴ + 2 ⁷⁵, что составляет 2 ¹⁰⁴ + 2 ⁷⁵ -1 от 2 ¹²⁸ -2 ¹⁰⁴ + 1.

Первоеближе, поэтому он выбирается как вычисляемый результат.Таким образом, в double добавление единицы к 2 ¹²⁸ -2 ¹⁰⁴ дает 2 ¹²⁸ -2 ¹⁰⁴.

Сноска

¹ Представление двоичного числа с плавающей запятой состоит из трех частей: знак s , равный +1 или -1, значение и f , то есть число с фиксированной точкой с фиксированным числом битов и показателем степени e , так что представленное число равно s • f • 2 ^e.Значение и можно представить как целое число с определенным числом битов, но его часто масштабируют, подстраивая показатель степени так, чтобы значение и нормальных чисел с плавающей запятой было в [1, 2).Например, 132 можно рассматривать как значение и 100001 ₂ раз 2 ² или как 1,00001 ₂ раз 2 ⁷.

Java Float.MAX_VALUE, чтобы удвоить

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Сноска

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Java Float.MAX_VALUE, чтобы удвоить

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Сноска

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы