Вот небольшой скрипт, который я написал для нахождения общего числа вхождений для различных элементов исходного кода в коде ActionScript 3 (это написано на Python просто потому, что я с ним знаком, в то время как Perl, вероятно, лучше подходит для регулярных выражений) -тяжелый сценарий, как это):
import sys, os, re
# might want to improve on the regexes used here
codeElements = {
'regex':re.compile('^\s*[(private|public|static)\s]*package\s+([A-Za-z0-9_.]+)\s*', re.MULTILINE),
'regex':re.compile('^\s*[(private|public|static|dynamic|final|internal|(\[Bindable\]))\s]*class\s', re.MULTILINE),
'regex':re.compile('^\s*[(private|public|static|dynamic|final|internal)\s]*interface\s', re.MULTILINE),
'regex':re.compile('^\s*[(private|public|static|protected|internal|final|override)\s]*function\s', re.MULTILINE),
'member variable':{
'regex':re.compile('^\s*[(private|public|static|protected|internal|(\[Bindable\]))\s]*var\s+([A-Za-z0-9_]+)(\s*\\:\s*([A-Za-z0-9_]+))*\s*', re.MULTILINE),
'todo note':{
'regex':re.compile('[*\s/][Tt][Oo]\s?[Dd][Oo][\s\-:_/]', re.MULTILINE),
totalLinesOfCode = 0
filePaths = []
for i in range(1,len(sys.argv)):
if os.path.exists(sys.argv[i]):
for filePath in filePaths:
thisFile = open(filePath,'r')
thisFileContents = thisFile.read()
totalLinesOfCode = totalLinesOfCode + len(thisFileContents.splitlines())
for codeElementName in codeElements:
matchSubStrList = codeElements[codeElementName]['regex'].findall(thisFileContents)
codeElements[codeElementName]['numFound'] = codeElements[codeElementName]['numFound'] + len(matchSubStrList)
for codeElementName in codeElements:
print str(codeElements[codeElementName]['numFound']) + ' instances of element "'+codeElementName+'" found'
print '---'
print str(totalLinesOfCode) + ' total lines of code'
print ''
Передайте пути ко всем файлам исходного кода в вашем проекте в качестве аргументов для этого скрипта, чтобы он обработал их все и сообщил итоги.
Команда, подобная этой:
find /path/to/project/root/ -name "*.as" -or -name "*.mxml" | xargs /path/to/script
Будет выводить что-то вроде этого:
1589 instances of element "function" found
147 instances of element "package" found
58 instances of element "todo note" found
13 instances of element "interface" found
2033 instances of element "member variable" found
156 instances of element "class" found
40822 total lines of code