У меня есть проект, в котором я должен исправить эту программу, которая имеет тенденцию аварийно завершать работу. Это программное обеспечение выполняет множество вычислений и обращений к базе данных и может иметь очень высокую нагрузку, что означает большое количество клиентов.
Это очень важный компонент, и без него ничего не работает. Он должен работать и иметь возможность работать без взаимодействия с пользователем в течение длительного времени.
На самом деле это родной проект C ++ / ATL с COM для связи между двумя исполняемыми файлами.
Сейчас я потратил много времени на изучение кода и поиск явных недостатков кода, таких как отсутствие блокировки общих переменных (очевидных), обработчиков исключений, которые ничего не делают с исключением, кроме ' return false ', даже если это может быть критическим исключением.
Но я хотел знать, есть ли у кого-нибудь какие-нибудь советы относительно того, как заняться подобным проектом, когда многие люди действительно пытались решить проблему и потерпели неудачу, и теперь вы приняли вызов и не хотите потерпеть неудачу.
Я готов пойти далеко, чтобы исправить это, однако мне нужно некоторое руководство относительно того, как сделать это хорошим способом?
Моя идея состоит в том, чтобы сначала настроить тестовую среду и надеяться собрать как можно больше информации о сбоях, которые происходят, а затем найти, посредством регистрации, трассировки стека и т. Д., Точки сбоев. Это может или не может быть хорошим способом отладки такого проекта.
Любой вклад приветствуется?