у нас есть кластер кассандры с 12 узлами, распределенный по 2 центрам обработки данных с 6 узлами в каждом центре данных. При попытке войти в систему cqlsh выдает ошибку ниже для большинства узлов и просто разрешает вход в систему на одном узле:
Connection error: ('Unable to connect to any servers', {'<server_IP>': OperationTimedOut('errors=Timed out creating connection (5 seconds), last_host=None',)})
Единственное отличие, которое я вижу, состоит в том, что узел, на котором он работает, не имеет заблокированного запроса для Native-Transport-Requests. Может ли это быть проблемой? Вот выходные данные tpstats от одного из узлов, где он не работает.
У нас также есть 2 запущенных сетевых приложения, одно из которых считывает данные из Кассандры, другое пишет в него. Мы также видим, что это приложение .net часто закрывается с Cassandra Нет исключений хоста . Это по той же причине?
