Говоря в целом, я думаю, вы должны сделать оба. Любые личные данные, которые вы собираете, являются просто ответственностью для вас, а не только потому, что вы намереваетесь опубликовать свои базы данных. Чем меньше вы сможете собрать, тем лучше.
Тем не менее, вы, вероятно, понимаете, что чувствительны не только идентификаторы и пароли. Помните утечка данных поиска AOL ? Или публикация базы данных Netflix? Даже не имея идентификаторов, людям удалось выяснить реальные идентификаторы некоторых учетных записей, просто собрав вместе данные о поведении пользователей и сопоставив их с данными из других мест. Некоторые люди смущены своими историями поиска и прокатом фильмов. Пойди разберись.
Поэтому я думаю, что общее правило должно заключаться в том, чтобы собирать как можно меньше и анонимизировать то, что осталось. Даже если вы не сохраните личность человека, соответствующего определенной учетной записи, вы можете захотеть зашифровать то, что сделали различные логины.
С другой стороны, бывают случаи, когда вам просто наплевать на такую конфиденциальность. Например, в Википедии практически все, что вы можете сделать на сайте, в любом случае является общедоступным. По крайней мере, все, что записывается в базе данных. Если информация уже доступна через API, нет смысла скрывать ее при загрузке базы данных.