C ++ Anagram Solver Оптимизация скорости - PullRequest
2 голосов
/ 05 апреля 2020

Я решил сделать решатель анаграмм для моего отца. Я довольно новичок в программировании, но я решил, что все еще могу это сделать. Мой готовый продукт работает, но он очень медленный, например, потребовалось около 15 минут, чтобы найти все комбинации из 8 символов. Я ищу способы оптимизировать его / сделать его быстрее.

Работа с MinGW c ++ compier, на Clion 2019.3.4, cpu: i7 9700k и RAM: 16 ГБ / 3200 МГц.

#include <iostream>
#include <string>
#include <vector>
#include <fstream>

using namespace std;

//Menu for interacting with user, not really important
void menu() {
    cout << "=========================" << endl;
    cout << "======== !WOW! ==========" << endl;
    cout << "=========================" << endl;
    cout << "1 ... INSERT" << endl;
    cout << "2 ... PRINT" << endl;
    cout << "3 ... LIMIT WORD LENTGH" << endl;
    cout << "4 ... NEW GAME" << endl;
    cout << "0 ... EXIT" << endl;
    cout << "=========================" << endl;
    cout << "Select: ";
}

//Function to find all possible combinations from letters of a given string 
void get(vector<string> &vec, string str, string res) {

    vec.push_back(res);

    for (int i = 0; i < str.length(); i++)
        get(vec, string(str).erase(i, 1), res + str[i]);
}

//Only for testing purposes
void printVec(vector<string> vec) {
    for (int i = 0; i < vec.size(); i++) {
        cout << vec[i] << " ";
    }
}

//Function to check if a given word exists in given .txt file
bool checkWord(vector<string> &vec2, string filename, string search) {

    string line;
    ifstream myFile;
    myFile.open(filename);

    if (myFile.is_open()) {
        while (!myFile.eof()) {
            getline(myFile, line);
            if (line == search) {
                vec2.push_back(line);
                return true;
            }
        }
        myFile.close();
    } else
        cout << "Unable to open this file." << endl;

    return false;
}


int main() {

    int selection;
    bool running = true;
    string stringOfChars;
    vector<string> vec;
    vector<string> vec2;

    do {

        menu();
        cin >> selection;
        switch (selection) {

            case 1:
                cout << "Insert letters one after another: ";
                cin >> stringOfChars;
                get(vec, stringOfChars, ""); //fill first vector(vec) with all possible combinations.
                break;

            case 2:
                for (int i = 0; i < vec.size(); i++) {
                    if (checkWord(vec2, "C:/file.txt", vec[i])) { //For each word in vector(vec) check if exists in file.txt, if it does, send it in vector(vec2) and return true
//Reason for vec2's existence is that later I want to implement functions to manipulate with possible solutions (like remove words i have already guessed, or as shown in case 3, to limit the word length)
                        cout << vec[i] << endl; //If return value == true cout the word
                    }
                }
                break;

            case 3:
                int numOfLetters;
                cout << "Word has a known number of letters: ";
                cin >> numOfLetters;
                for (int i = 0; i < vec2.size(); i++) { /*vec2 is now filled with all the answers, we can limit the output if we know the length of the word */
                    if (vec2[i].length() == numOfLetters) {
                        cout << vec2[i] << endl;
                    }
                }
                break;

            case 4:
                vec.clear();
                vec2.clear();
                break;

            case 0:
                running = false;
                break;

            default:
                cout << "Wrong selection!" << endl;
                break;
        }
        cout << endl;
    } while (running);

    return 0;
}


file.txt заполнен всеми словами на моем языке, он упорядочен по алфавиту и имеет размер 50 МБ.

aachecnska
aachenskega
aachenskem
aachenski
.
.
.
bab
baba
babah
.
.
.

Любые рекомендации или советы от topi c будут полезно. Одна из моих идей состоит в том, чтобы, возможно, разделить файл file.txt на файлы меньшего размера, например, поместить строки с одинаковыми начальными буквами в собственный файл, чтобы A.txt содержал только слова, начинающиеся с A et c ... И чем изменить код соответственно.

1 Ответ

1 голос
/ 05 апреля 2020

Здесь вам нужно использовать профилировщик . на Linux мой фаворит - kcachgrind

http://kcachegrind.sourceforge.net/html/Home.html

, он дает вам построчную информацию о времени и говорит, какую часть кода вам следует оптимизировать наиболее.

конечно, есть много доступных профилировщиков, в том числе коммерческих.

...