Мой опыт использования процессоров Intel и x86_64 заключается в том, что каждый раз, когда я пытался сказать gcc об оптимизации для конкретного типа процессора, производительность становилась хуже, чем с -march = generic, а не лучше. YMMV, конечно, но я играл с такими вещами много раз за эти годы, и это всегда было так.
OTOH, на i386 может иметь смысл ориентироваться как минимум на i686 или, если вам нужна математика SSE, как минимум на Pentium 4.