Есть ли скрипт, который может извлечь конкретную ссылку из TXT и записать ее в другой TXT-файл? - PullRequest
0 голосов
/ 14 апреля 2020

Я ищу сценарий (или, если нет, думаю, мне придется написать свой). Я хотел спросить, знает ли кто-нибудь здесь скрипт, который может взять текстовый файл с n ссылками (скажем, 200). Мне нужно извлечь только ссылки, которые содержат определенные символы, скажем, мне нужны только ссылки, которые содержат "/ r / learnprogramming". Мне нужен скрипт, чтобы получить эти ссылки и записать их в другие текстовые файлы.

Редактировать: Вот что мне помогло: grep -i "/ r / learnprogramming" 1.txt> 2.txt

Ответы [ 2 ]

0 голосов
/ 14 апреля 2020

Если вы используете linux или macOS, вы можете использовать cat и grep для вывода ссылок.

cat in.txt | grep /r/programming > out.txt

Решение, предоставленное OP:

grep -i "/ r / learnprogramming" 1.txt> 2.txt

0 голосов
/ 14 апреля 2020

Поскольку вы не указали точный формат документа, я предполагаю, что эти ссылки разделены символами новой строки. В этом случае код довольно прост с использованием Python / awk, поскольку вы можете перебирать file.readlines () и печатать только те из них, которые соответствуют вашему шаблону (либо с помощью lines.contains (pattern), либо с помощью регулярное выражение, если шаблон более сложный). Чтобы сохранить ссылки в новом файле, просто перенаправьте стандартный вывод в новый файл следующим образом:

python script.py > links.txt

Решение, описанное выше, работает, даже если ссылки разделены произвольным символом s , сначала прочитать файл в одну строку и разбить его на s . Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...