Я сделаю все возможное, чтобы объяснить это здесь простыми терминами, но имейте в виду, что эта тема займет у моих студентов пару месяцев, чтобы наконец понять. Вы можете найти больше информации о главе 2 Структуры данных и алгоритмов в Java book.
Не существует механической процедуры , которую можно использовать для получения BigOh.
Как «кулинарная книга», чтобы получить BigOh из фрагмента кода, вам сначала нужно понять, что вы создаете математическую формулу, чтобы подсчитать, сколько шагов вычислений выполнено с учетом ввода некоторых размер.
Цель проста: сравнить алгоритмы с теоретической точки зрения без необходимости выполнения кода. Чем меньше количество шагов, тем быстрее алгоритм.
Например, предположим, у вас есть этот кусок кода:
int sum(int* data, int N) {
int result = 0; // 1
for (int i = 0; i < N; i++) { // 2
result += data[i]; // 3
}
return result; // 4
}
Эта функция возвращает сумму всех элементов массива, и мы хотим создать формулу для подсчета сложности вычислений этой функции:
Number_Of_Steps = f(N)
Итак, у нас есть f(N)
, функция для подсчета количества вычислительных шагов. Ввод функции - это размер обрабатываемой структуры. Это означает, что эта функция называется так:
Number_Of_Steps = f(data.length)
Параметр N
принимает значение data.length
. Теперь нам нужно актуальное определение функции f()
. Это делается из исходного кода, в котором каждая интересующая строка пронумерована от 1 до 4.
Есть много способов вычислить BigOh. С этого момента мы будем предполагать, что каждое предложение, которое не зависит от размера входных данных, принимает постоянное C
число вычислительных шагов.
Мы собираемся добавить индивидуальное количество шагов функции, и ни объявление локальной переменной, ни инструкция возврата не зависят от размера массива data
.
Это означает, что в строках 1 и 4 выполняется C количество шагов каждая, и функция выглядит примерно так:
f(N) = C + ??? + C
Следующая часть должна определить значение оператора for
. Помните, что мы рассчитываем количество вычислительных шагов, то есть тело оператора for
выполняется N
раз. Это то же самое, что добавить C
, N
раз:
f(N) = C + (C + C + ... + C) + C = C + N * C + C
Не существует механического правила для подсчета того, сколько раз выполняется тело for
, вам нужно посчитать его, посмотрев, что делает код. Чтобы упростить вычисления, мы игнорируем части инициализации, условия и приращения переменной оператора for
.
Чтобы получить фактическое значение BigOh, нам понадобится Асимптотический анализ функции. Это примерно так:
- Уберите все константы
C
.
- Из
f()
получите полином в его standard form
.
- Разделите члены полиномиума и отсортируйте их по скорости роста.
- Держите тот, который увеличивается, когда
N
приближается к infinity
.
Наше f()
имеет два термина:
f(N) = 2 * C * N ^ 0 + 1 * C * N ^ 1
Удаление всех C
констант и избыточных частей:
f(N) = 1 + N ^ 1
Так как последний член становится тем, который увеличивается, когда f()
приближается к бесконечности (подумайте о limit ), это аргумент BigOh, а функция sum()
имеет BigOh:
O(N)
Есть несколько хитростей, чтобы решить некоторые хитрые: используйте суммирования всякий раз, когда можете.
Например, этот код может быть легко решен с помощью суммирования:
for (i = 0; i < 2*n; i += 2) { // 1
for (j=n; j > i; j--) { // 2
foo(); // 3
}
}
Первое, что вам нужно было спросить, это порядок исполнения foo()
. Хотя обычно это O(1)
, вы должны спросить об этом своих профессоров. O(1)
означает (почти, в основном) постоянную C
, не зависящую от размера N
.
Утверждение for
в предложении номер один сложно. Пока индекс заканчивается на 2 * N
, приращение делается на два. Это означает, что первые for
выполняются только N
шагов, и нам нужно разделить счет на два.
f(N) = Summation(i from 1 to 2 * N / 2)( ... ) =
= Summation(i from 1 to N)( ... )
Номер предложения two еще сложнее, поскольку зависит от значения i
. Посмотрите: индекс i принимает значения: 0, 2, 4, 6, 8, ..., 2 * N, а второй for
выполняется: N раз первый, N - 2 второй, N - 4 третий ... до этапа N / 2, на котором второй for
никогда не выполняется.
По формуле это означает:
f(N) = Summation(i from 1 to N)( Summation(j = ???)( ) )
Опять же, мы считаем количество шагов . И по определению, каждое суммирование всегда должно начинаться с единицы и заканчиваться числом, большим или равным единице.
f(N) = Summation(i from 1 to N)( Summation(j = 1 to (N - (i - 1) * 2)( C ) )
(Мы предполагаем, что foo()
равно O(1)
и делает C
шагов.)
У нас здесь проблема: когда i
принимает значение N / 2 + 1
вверх, внутреннее суммирование заканчивается отрицательным числом! Это невозможно и неправильно. Нам нужно разделить суммирование на две части, являясь поворотной точкой в момент, когда i
занимает N / 2 + 1
.
.
f(N) = Summation(i from 1 to N / 2)( Summation(j = 1 to (N - (i - 1) * 2)) * ( C ) ) + Summation(i from 1 to N / 2) * ( C )
С момента поворота i > N / 2
внутренний for
не будет выполнен, и мы предполагаем постоянную сложность выполнения C в его теле.
Теперь суммирование можно упростить с помощью некоторых правил идентификации:
- Суммирование (ш от 1 до N) (C) = N * C
- Суммирование (w от 1 до N) (A (+/-) B) = Суммирование (w от 1 до N) (A) (+/-) Суммирование (w от 1 до N) (B)
- Суммирование (w от 1 до N) (w * C) = C * Суммирование (w от 1 до N) (w) (C является константой, независимой от
w
)
- Суммирование (w от 1 до N) (w) = (N * (N + 1)) / 2
Применение некоторой алгебры:
f(N) = Summation(i from 1 to N / 2)( (N - (i - 1) * 2) * ( C ) ) + (N / 2)( C )
f(N) = C * Summation(i from 1 to N / 2)( (N - (i - 1) * 2)) + (N / 2)( C )
f(N) = C * (Summation(i from 1 to N / 2)( N ) - Summation(i from 1 to N / 2)( (i - 1) * 2)) + (N / 2)( C )
f(N) = C * (( N ^ 2 / 2 ) - 2 * Summation(i from 1 to N / 2)( i - 1 )) + (N / 2)( C )
=> Summation(i from 1 to N / 2)( i - 1 ) = Summation(i from 1 to N / 2 - 1)( i )
f(N) = C * (( N ^ 2 / 2 ) - 2 * Summation(i from 1 to N / 2 - 1)( i )) + (N / 2)( C )
f(N) = C * (( N ^ 2 / 2 ) - 2 * ( (N / 2 - 1) * (N / 2 - 1 + 1) / 2) ) + (N / 2)( C )
=> (N / 2 - 1) * (N / 2 - 1 + 1) / 2 =
(N / 2 - 1) * (N / 2) / 2 =
((N ^ 2 / 4) - (N / 2)) / 2 =
(N ^ 2 / 8) - (N / 4)
f(N) = C * (( N ^ 2 / 2 ) - 2 * ( (N ^ 2 / 8) - (N / 4) )) + (N / 2)( C )
f(N) = C * (( N ^ 2 / 2 ) - ( (N ^ 2 / 4) - (N / 2) )) + (N / 2)( C )
f(N) = C * (( N ^ 2 / 2 ) - (N ^ 2 / 4) + (N / 2)) + (N / 2)( C )
f(N) = C * ( N ^ 2 / 4 ) + C * (N / 2) + C * (N / 2)
f(N) = C * ( N ^ 2 / 4 ) + 2 * C * (N / 2)
f(N) = C * ( N ^ 2 / 4 ) + C * N
f(N) = C * 1/4 * N ^ 2 + C * N
И BigOh это:
O(N²)