Я пишу программу, которая пытается дублировать алгоритм, описанный в начале этой статьи,
http://www -stat.stanford.edu / ~ cgates / PERSI / документы / MCMCRev.pdf
F - это функция от символа к символу. Предположим, что Pl (f) является мерой «правдоподобия» этой функции. Алгоритм:
Начиная с предварительного предположения о функции, скажем, f, а затем новой функции f * -
- Вычислить Pl (f).
- Измените на f *, сделав случайное преобразование значений, назначаемых двум символам.
- Вычислить Pl (f *); если это больше, чем Pl (f), примите f *.
- Если нет, переверните монету Pl (f) / Pl (f *); если дело доходит до головы, прими f *.
- Если бросок монеты выпадает из хвоста, оставайтесь по адресу f.
Я реализую это с помощью следующего кода. Я использую c #, но попытался сделать его несколько более простым для всех. Если есть лучший форум для этого, пожалуйста, дайте мне знать.
var current_f = Initial(); // current accepted function f
var current_Pl_f = InitialPl(); // current plausibility of accepted function f
for (int i = 0; i < 10000; i++)
{
var candidate_f = Transpose(current_f); // create a candidate function
var candidate_Pl_f = ComputePl(candidate_f); // compute its plausibility
if (candidate_Pl_f > current_Pl_f) // candidate Pl has improved
{
current_f = candidate_f; // accept the candidate
current_Pl_f = candidate_Pl_f;
}
else // otherwise flip a coin
{
int flip = Flip();
if (flip == 1) // heads
{
current_f = candidate_f; // accept it anyway
current_Pl_f = candidate_Pl_f;
}
else if (flip == 0) // tails
{
// what to do here ?
}
}
}
Мой вопрос заключается в том, выглядит ли это как оптимальный подход к реализации этого алгоритма. Похоже, я застреваю в некоторых локальных максимумах / локальных минимумах, несмотря на реализацию этого метода.
РЕДАКТИРОВАТЬ - Вот, по сути, метод Transpose (). Я использую словарь / хэш-таблицу типа << char, char >>, которые функции-кандидаты используют для просмотра любого данного преобразования char -> char. Таким образом, метод транспонирования просто меняет два значения в словаре, который определяет поведение функции.
private Dictionary<char, char> Transpose(Dictionary<char, char> map, params int[] indices)
{
foreach (var index in indices)
{
char target_val = map.ElementAt(index).Value; // get the value at the index
char target_key = map.ElementAt(index).Key; // get the key at the index
int _rand = _random.Next(map.Count); // get a random key (char) to swap with
char rand_key = map.ElementAt(_rand).Key;
char source_val = map[rand_key]; // the value that currently is used by the source of the swap
map[target_key] = source_val; // make the swap
map[rand_key] = target_val;
}
return map;
}
Имейте в виду, что функция-кандидат, которая использует базовый словарь, в основном просто:
public char GetChar(char in, Dictionary<char, char> theMap)
{
return theMap[char];
}
И это функция, которая вычисляет Pl (f):
public decimal ComputePl(Func<char, char> candidate, string encrypted, decimal[][] _matrix)
{
decimal product = default(decimal);
for (int i = 0; i < encrypted.Length; i++)
{
int j = i + 1;
if (j >= encrypted.Length)
{
break;
}
char a = candidate(encrypted[i]);
char b = candidate(encrypted[j]);
int _a = GetIndex(_alphabet, a); // _alphabet is just a string/char[] of all avl chars
int _b = GetIndex(_alphabet, b);
decimal _freq = _matrix[_a][_b];
if (product == default(decimal))
{
product = _freq;
}
else
{
product = product * _freq;
}
}
return product;
}