У меня есть массив:
tokens = [["hello","world"],["hello","ruby"]]
all_tokens = tokens.flatten.uniq # all_tokens=["hello","world","ruby"]
Теперь мне нужно создать два массива, соответствующих all_tokens, где первый массив будет содержать позицию каждого слова в подмассиве токенов. I.E Выход:
[[0,0],[1],[1]] # (w.r.t all_tokens)
Чтобы было понятно, он гласит: индекс "привет" равен 0 и 0 в 2 под-массивах токенов.
И второй массив содержит индекс каждого слова w.r.t tokens.I.E Вывод:
[[0,1],[0],[1]]
Чтобы было понятно, он читает, индекс привет 0,1. I.E "привет" в индексах 0 и 1 массива токенов.
Ура!