Я не уверен, как именно сформулировать этот вопрос, поэтому вот пример:
string1 = "THEQUICKBROWNFOX" string2 = "KLJHQKJBKJBHJBJLSDFD"
Я хочу функцию, которая будет оценивать string1выше, чем string2 и миллион других бессмысленных строк.Обратите внимание на отсутствие пробелов, так что это символьная функция, а не пословная.
В 90-х годах я написал функцию подсчета триграмм в Delphi и заполнил ее триграммами от Гека Финнаи я подумываю перенести код на C или Python или добавить его в автономный инструмент, но сейчас должны быть более эффективные способы.Я буду делать это миллионы раз, так что скорость хорошая.Я попробовал библиотеку Python Reverend.Thomas Beyse () и натренировал ее на некоторых строчках-заглавных буквах, но, похоже, для этого требуются пробелы между словами, и поэтому возвращается оценка [].Я нашел несколько библиотек цепей Маркова, но они также, казалось, требовали пробелов между словами.Хотя из моего понимания их я не понимаю, почему так должно быть ...
Во всяком случае, я много занимаюсь криптоанализом, поэтому в будущем функции подсчета, которые используют пробелы и знаки препинания, будут полезны, но сейчас мне нужны только ALLCAPITALLETTERS.
Спасибо за помощь!