Начните с растрового изображения из 10000 элементов всех нулей, закрасьте все квадраты как единые и подсчитайте нулевые биты, когда вы закончите.
Математика будет намного быстрее, если вы будете использовать квадрат 128x128, который может быть представлен 128 парами 64-битных целых без знака в 64-битной архитектуре или группами из четырех 32-битных целых без знака в 32-битной чип.