Лучший парсер PHP есть SimplePie , ИМХО. Я использую это в течение многих лет. Он отлично подходит для захвата и анализа следующего: RSS 0.90, RSS 0.91 (Netscape), RSS 0.91 (Userland), RSS 0.92, RSS 1.0, RSS 2.0, Atom 0.3, Atom 1.0; включая следующие пространства имен: Dublin Core 1.0, Dublin Core 1.1, GeoRSS, iTunes RSS 1.0 (в основном завершено), Media RSS 1.1.1, модуль содержимого RSS 1.0, W3C WGS84 Basic Geo, XML 1.0, XHTML 1.0
SimplePie 1.2 даже имеет кэширование базы данных, поэтому в нем должно быть все, что вам нужно, чтобы делать то, что вы хотите.
А если вам нужно проанализировать сырые XML-файлы, попробуйте использовать XMLize
-Trystian