Перемещение, переименование огромного количества текстовых файлов в зависимости от содержимого и размера - PullRequest
0 голосов
/ 28 июня 2011

* Обновление 4 июля *

В итоге я сделал следующее:

  1. Сортировка по дате
  2. Проверьте, совпадает ли последнее предложение
  3. Если Да: если больше -> это новое сообщение, которое нужно выбрать.Если меньше: удалите.Если больше ничего не может быть найдено, выберите этот и перейдите в другую папку.
  4. Если Нет: двигаться дальше.Повторяйте это до тех пор, пока все файлы с определенной датой не будут проверены.

Спасибо всем за помощь !!


Я занят большим проектом, где у меня естьОгромное количество писем, которые мне приходится фильтровать, импортируется из gmail через thunderbird.Хотя есть большая проблема.Поскольку в gmail используются разговоры, а Thunderbird не форматирует их как таковые, у меня есть текстовый файл для каждого письма, хотя также и полный предыдущий разговор.И так, целый новый текстовый файл для каждого ответа. Для пояснения, пример разговора:

Me:Hi, how are you?
You, replying: Good!
Me: Great!

В gmail это выглядит точно так же, как и выше, но для меня это теперь 3 файла:

  • файл 1:

    Me, sent at 11:41:
    Hi, how are you?
    
  • файл 2:

    You, sent at 11:42:
    Good!
    
    Me, sent at 11:41:
    Hi how are you?
    
  • файл 3:

    Me, sent at 11:43:
    Great!
    
    You, sent at 11:42:
    Good!
    
    Me, sent at 11:41:
    Hi how are you?
    

Как вы понимаете, это не проблема с 3 файлами: я просто выбрасываю файлы 1 и 2 и использую только файл 3. Это именно то, что я хочу сделать.Но учитывая, что в общей сложности существует около 30 тыс. Файлов, я бы очень хотел автоматизировать это.

К сожалению, это невозможно сделать по имени файла, хотя частично это возможно.Файлы названы в честь их даты.Например: 20110102 за 2 января 2011 г. Однако, поскольку в день происходит несколько разговоров по электронной почте, я бы много потерял, если бы просто сортировал по дате и сохранял только самые большие значения.

Надеюсь, проблема в том,ясно, и вы можете помочь мне с этим.Я работаю на Mac OSX 10.7.Я пытался использовать Applescript, но либо мой сценарий не подходит, либо Applescript не может обработать количество файлов.Может быть, у вас есть рекомендации по программному обеспечению или сценарию?Я открыт для всех и не знаком с программированием.

Заранее спасибо!

1 Ответ

2 голосов
/ 28 июня 2011

Поскольку ваша задача в основном - просто обработка текста, любой язык, с которым вы знакомы, включая AppleScript, PHP, bash, C, должен уметь выполнять эту работу.Я думаю, что, возможно, @ inTide разбивает проблему на отдельные шаги, это то, что вам нужно сделать, создавая одну порцию за раз на выбранном вами языке.

Выберите язык, который вам знаком, и начинайте писатьОдин код на первом шаге и убедитесь, что он работает так, как вы ожидаете, а затем разверните, добавив немного новых функций в каждой точке и убедившись, что функциональность работает, прежде чем двигаться дальше.Без примера написанного вами кода или лучшего описания того, как AppleScript дает сбой, дополнительные советы затруднительны.

...