Это один из двух распространенных подходов, так что да.И да, игнорирование тегов, которые не представляют интереса, является хорошим способом справиться с этим.Если вам это не нужно, не нужно это принимать к сведению.Если вы заранее точно знаете, какие теги вам нужны, вам, вероятно, не нужно обходить все дерево DOM.
Вы также можете использовать синтаксический анализатор SAX, который, вероятно, будет быстрее и менее ресурсоемким, хотя, вероятно, нетнеобходимо в этом случае, в зависимости от того, сколько результатов вы хотите получить в ленте.