Я хочу создать матрицу условий документа. В моем случае это не документы x слова, а предложения x слова, поэтому предложения будут выступать в качестве документов. Я использую нормализацию 'l2' после создания c -терминовой матрицы.
Мне важно использовать термин count для создания суммирования с использованием SVD на следующих шагах.
Мой запрос - это какая ось будет уместно применить нормализацию 'l2'. При достаточном исследовании я понял:
- Ось = 1: даст мне важность слова в предложении (по столбцам нормализация)
- Ось = 0: Важность слова в документ (построчная нормализация).
Даже зная теорию, я не могу решить, какую альтернативу выбрать, потому что выбор сильно повлияет на мои результаты обобщения. Так что, будьте добры, наведите мне решение и объясните причину.