Question

На компьютере с Linux я хотел бы проследить иерархию папок и получить список всех различных расширений файлов в ней.

Каков наилучший способ добиться этого из оболочки?

Ivan Nevostruev · Answer 1 · 03 декабря 2009

Попробуйте (не уверен, что это лучший способ, но он работает):

find . -type f | perl -ne 'print $1 if m/\.([^.\/]+)$/' | sort -u

Это работает следующим образом:

Найти все файлы из текущей папки
Печатает расширение файлов, если есть
Составить уникальный отсортированный список

SiegeX · Answer 2 · 24 августа 2011

Нет необходимости в трубе до sort, awk может сделать все это:

find . -type f | awk -F. '!a[$NF]++{print $NF}'

ChristopheD · Answer 3 · 03 декабря 2009

Рекурсивная версия:

find . -type f | sed -e 's/.*\.//' | sed -e 's/.*\///' | sort -u

Если вы хотите итоги (как, возможно, раз видели расширение):

find . -type f | sed -e 's/.*\.//' | sed -e 's/.*\///' | sort | uniq -c | sort -rn

Не рекурсивный (одна папка):

for f in *.*; do printf "%s\n" "${f##*.}"; done | sort -u

Я основал это на этом сообщении на форуме , кредит должен идти туда.

Simon R · Answer 4 · 23 апреля 2010

Powershell:

dir -recurse | select-object extension -unique

Благодаря http://kevin -berridge.blogspot.com / 2007/11 / windows-powershell.html

user224243 · Answer 5 · 04 декабря 2009

Найти все с точкой и показать только суффикс.

find . -type f -name "*.*" | awk -F. '{print $NF}' | sort -u

если вы знаете, что все суффиксы состоят из 3 символов, то

find . -type f -name "*.???" | awk -F. '{print $NF}' | sort -u

или с sed показывает все суффиксы от одного до четырех символов. Измените {1,4} на диапазон символов, которые вы ожидаете в суффиксе.

find . -type f | sed -n 's/.*\.\(.\{1,4\}\)$/\1/p'| sort -u

gkb0986 · Answer 6 · 15 июля 2013

Добавление моего собственного варианта в микс. Я думаю, что это самый простой из всех и может быть полезен, когда эффективность не имеет большого значения.

find . -type f | grep -o -E '\.[^\.]+$' | sort -u

Ondra Žižka · Answer 7 · 23 марта 2019

Моя альтернатива без awk, sed, менее, Perl, Python-совместимая альтернатива:

find . -type f | rev | cut -d. -f1 | rev  | tr '[:upper:]' '[:lower:]' | sort | uniq --count | sort -rn

Хитрость в том, что она переворачивает линию и обрезает расширение в начале.
Он также преобразует расширения в нижний регистр.

Пример вывода:

   3689 jpg
   1036 png
    610 mp4
     90 webm
     90 mkv
     57 mov
     12 avi
     10 txt
      3 zip
      2 ogv
      1 xcf
      1 trashinfo
      1 sh
      1 m4v
      1 jpeg
      1 ini
      1 gqv
      1 gcs
      1 dv

Shinrai · Answer 8 · 26 мая 2014

Я попробовал кучу ответов здесь, даже самый лучший ответ. Все они не соответствовали тому, что я был конкретно после. Таким образом, помимо последних 12 часов сидения в коде регулярных выражений для нескольких программ, чтения и тестирования этих ответов, я пришел к тому, что работает именно так, как я хочу.

 find . -type f -name "*.*" | grep -o -E "\.[^\.]+$" | grep -o -E "[[:alpha:]]{2,16}" | awk '{print tolower($0)}' | sort -u

Находит все файлы, которые могут иметь расширение.
Greps только расширение
Greps для расширений файлов от 2 до 16 символов (просто измените числа, если они не соответствуют вашим потребностям). Это помогает избежать кеширования файлов и системных файлов (системный файл предназначен для поиска в тюрьме).
Awk для печати расширений в нижнем регистре.
Сортировка и ввод только уникальных значений. Первоначально я пытался попробовать ответить на awk, но он удвоил бы печать элементов, которые варьировались в зависимости от регистра.

Если вам нужно количество расширений файлов, используйте приведенный ниже код

find . -type f -name "*.*" | grep -o -E "\.[^\.]+$" | grep -o -E "[[:alpha:]]{2,16}" | awk '{print tolower($0)}' | sort | uniq -c | sort -rn

Хотя выполнение этих методов займет некоторое время и, вероятно, не является лучшим способом решения проблемы, они работают.

Обновление: Для @ alpha_989 длинных расширений файлов возникнет проблема. Это связано с оригинальным регулярным выражением "[[: alpha:]] {3,6}". Я обновил ответ, включив в него регулярное выражение "[[: alpha:]] {2,16}". Однако любой, кто использует этот код, должен знать, что эти числа - это минимальное и максимальное значения того, как долго разрешено расширение для окончательного вывода. Все, что находится за пределами этого диапазона, будет разбито на несколько строк на выходе.

Примечание: Оригинальный пост действительно читал "- Greps для расширений файлов от 3 до 6 символов (просто откорректируйте числа, если они не соответствуют вашим потребностям). Это помогает избежать кеширования файлов и системных файлов (бит системных файлов предназначен для поиска тюрьма). "

Идея: Может быть использовано для поиска расширений файлов определенной длины с помощью:

 find . -type f -name "*.*" | grep -o -E "\.[^\.]+$" | grep -o -E "[[:alpha:]]{4,}" | awk '{print tolower($0)}' | sort -u

Где 4 - это длина расширений файла, которую нужно включить, а затем найти также любые расширения, превышающие эту длину.

Andres Restrepo · Answer 9 · 24 августа 2012

В Python, используя генераторы для очень больших каталогов, включая пустые расширения, и получая количество раз, которое каждое расширение показывает:

import json
import collections
import itertools
import os

root = '/home/andres'
files = itertools.chain.from_iterable((
    files for _,_,files in os.walk(root)
    ))
counter = collections.Counter(
    (os.path.splitext(file_)[1] for file_ in files)
)
print json.dumps(counter, indent=2)

Dmitry B. · Answer 10 · 22 мая 2018

Я не думаю, что это было упомянуто еще:

find . -type f -exec sh -c 'echo "${0##*.}"' {} \; | sort | uniq -c

Как я могу найти все отдельные расширения файлов в иерархии папок?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 14 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как я могу найти все отдельные расширения файлов в иерархии папок?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 14 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы