Я хотел бы сканировать частный репозиторий на github (очевидно, у меня есть доступ к нему). Я хочу, чтобы извлечь конкретные ссылки, репо, который содержит файл для конкретного расширения. Какой самый эффективный способ сделать это? Я ищу веб-сканер в Python или Groovy.
Рассмотрим репо X со следующей структурой.
X
|-Y
|-A
|-abc.png
|-B
|-D
|-E
|-xyz.png
|-F
Я хочу, чтобы выходные данные были X / Y / A и X / Y / E. (Мне нужна ссылка на родительскую структуру вместо ссылки на файл PNG.