Как уже говорили другие, проблема заключается в сохранении в ячейке памяти в массиве: x[i][j]
. Вот немного понимания, почему:
У вас есть двумерный массив, но память в компьютере по своей сути является одномерной. Итак, пока вы представляете свой массив следующим образом:
0,0 | 0,1 | 0,2 | 0,3
----+-----+-----+----
1,0 | 1,1 | 1,2 | 1,3
----+-----+-----+----
2,0 | 2,1 | 2,2 | 2,3
Ваш компьютер сохраняет его в памяти одной строкой:
0,0 | 0,1 | 0,2 | 0,3 | 1,0 | 1,1 | 1,2 | 1,3 | 2,0 | 2,1 | 2,2 | 2,3
Во 2-м примере вы получаете доступ к массиву, сначала циклически перебирая 2-е число, т. Е .:
x[0][0]
x[0][1]
x[0][2]
x[0][3]
x[1][0] etc...
Это означает, что вы бьете их всех по порядку. Теперь посмотрим на 1-ую версию. Вы делаете:
x[0][0]
x[1][0]
x[2][0]
x[0][1]
x[1][1] etc...
Из-за способа, которым C выложил в память двумерный массив, вы просите его перепрыгнуть повсюду. Но теперь для кикера: почему это важно? Все обращения к памяти одинаковы, верно?
Нет: из-за кешей. Данные из вашей памяти передаются в ЦП небольшими порциями (называемыми «строками кэша»), обычно размером 64 байта. Если у вас есть 4-байтовые целые числа, это означает, что вы получаете 16 последовательных целых чисел в аккуратном небольшом пакете. На самом деле довольно медленно загружать эти куски памяти; ваш процессор может выполнять большую работу за время, необходимое для загрузки одной строки кэша.
Теперь оглянемся назад на порядок доступа: второй пример: (1) захват фрагмента из 16 дюймов, (2) изменение всех из них, (3) повторение 4000 * 4000/16 раз. Это приятно и быстро, и процессору всегда есть над чем работать.
Первый пример: (1) получить кусок из 16 дюймов, (2) изменить только один из них, (3) повторить 4000 * 4000 раз. Для этого потребуется 16-кратное количество «выборок» из памяти. Вашему ЦП на самом деле придется сидеть и ждать, пока появится эта память, а пока вы сидите, вы теряете драгоценное время.
Важное примечание:
Теперь, когда у вас есть ответ, вот интересная заметка: нет никакой внутренней причины, по которой ваш второй пример должен быть быстрым. Например, в Фортране первый пример будет быстрым, а второй - медленным. Это потому, что вместо того, чтобы разложить вещи в концептуальные «строки», как это делает C, Fortran расширяется в «столбцы», т. Е .:
0,0 | 1,0 | 2,0 | 0,1 | 1,1 | 2,1 | 0,2 | 1,2 | 2,2 | 0,3 | 1,3 | 2,3
Макет C называется «мажор строк», а фортран - «мажор столбцов». Как видите, очень важно знать, является ли ваш язык программирования основным или основным столбцом! Вот ссылка для получения дополнительной информации: http://en.wikipedia.org/wiki/Row-major_order