Разбор текстового файла с использованием getline и присвоение частей каждой строки различным переменным в массиве - PullRequest
0 голосов
/ 25 марта 2020

Я пишу программу на C ++, с помощью которой я хочу читать и анализировать строки из (.pdb) текстового файла. Строки выглядят так:

ATOM # CHAR 0 FLOAT1 FLOAT2 FLOAT3 1.00 0.00 CHAR

Где # - целое число (номер атома), а CHAR - символ атома (в данном случае O или Si). FLOAT - это координаты x, y и z соответственно.

Первые три строки:

ATOM      1  O          0      0.024  8.489  10.490  1.00  0.00        O
ATOM      2  O          0     10.069  1.380  9.223   1.00  0.00        O
ATOM      3  O          0     20.066  11.249 2.652   1.00  0.00        O

До сих пор мне удавалось читать текст построчно и сканировать содержимое используя sscanf. Однако я не могу сохранить данные в массиве Atom class, который я создал. Вот как выглядит класс, который включен в мой заголовочный файл:

class Atom  {
public:
        Atom()
        {};'

        int atom_num;
        char atom_sym[2];
        float atom_x, atom_y, atom_z;
};

Вот раздел моей программы, где я анализирую строки:

int main()
{
    int i;
    int Linecount = 0;

    char ign_a, ign_t, ign_o, ign_m; // I use these to store the ATOM of each line
    int ign1;  // I use this to store the 0 that appears before the coordinates of each line

    std::string filename = "textfile.pdb"
    std::ifstream file;

    file.open (filename.c_str());
    if (file.is_open())  {
        std::string line;
        while (getline(file, line))
            ++Linecount;
    }
    file.close();

    Atom atomList[Linecount];

    file.open (filename.c_str());
    if (file.is_open())  {
        std::string line;
        int atom_num;
        char atom_sym[2];
        float atom_x, atom_y, atom_z;
        for (i = 1; i < Linecount; ++i)  { // I have tried this for loop in different sections of the program but nothing seems to work
            while (getline(file, line))  {
                if (line.find("ATOM") == 0)  {
                    sscanf(line.c_str(), "%c%c%c%c %d %s %d %f %f %f", &ign_a, &ign_t, &ign_o, &ign_m,
                            &atom_num, atom_sym, &ign1, &atom_x, &atom_y, &atom_z); //

                    atomList[i].atom_num = atom_num; // This is where I attempt to store the data into the array
                    strcpy(atomList[i].atom_sym, atom_sym);
                    atomList[i].atom_x = atom_x;
                    atomList[i].atom_y = atom_y;
                    atomList[i].atom_z = atom_z;
                }

                    printf("%d %s %.3f %.3f %.3f\n", atomList[i].atom_num, atomList[i].atom_sym,
                            atomList[i].atom_x, atomList[i].atom_y, atomList[i].atom_z); // Test parsing of lines
            }
    }
    file.close();

    int j = 10;
    printf("TEST: %d %s %.3f %.3f %.3f\n", atomList[j].atom_num, atomList[j].atom_sym,
            atomList[j].atom_x, atomList[j].atom_y, atomList[j].atom_z);  // Print function to test storing into array

return 0;
}

Первая функция печати появляется работать правильно, хотя он печатает три «мусорные» строки, которые, как я полагаю, связаны с заголовком текстового файла, несмотря на использование оператора if (line.find("ATOM") == 0). Вот вывод до третьей строки:

0 0.000 0.000 0.000
0 0.000 0.000 0.000
0 0.000 0.000 0.000
1 O 0.024 8.489 10.490
2 O 10.069 1.380 9.223
3 O 20.066 11.249 2.652

Вторая функция печати, однако, печатает только нулевые значения, что указывает на то, что данные не сохраняются в массив правильно. Я также пытался использовать std::cin и std::cout для назначения и печати данных, но это не помогло. Вот вывод для второй функции печати:

TEST: 0 0.000 0.000 0.000

Моя главная проблема заключается в том, что я не могу сохранить данные из входного файла в массив atomList [i] класса Atom. Я попытался переместить for l oop вокруг, а также сканировать непосредственно в переменные atomList [i] среди других вещей, но я застрял в этой точке. Что мне нужно изменить, чтобы строки читались одна за другой и правильная информация сохранялась в массиве?

Буду признателен за любую помощь в этом. Спасибо!

1 Ответ

0 голосов
/ 25 марта 2020

Не уверен, что это ответит на любой из ваших вопросов, но вот способ сделать это. Он не использует ни одного из старых идиом типа C типа scanf и необработанных массивов.

#include <iostream>
#include <fstream>
#include <iomanip>
#include <vector>
#include <string>
#include <sstream>

// Overloaded extraction operator
std::istream& operator>>(std::istream& i, Atom& a)
{
    std::string temp;
    int temp2;

    if (i >> temp
          >> a.atom_num
          >> a.atom_sym
          >> temp2
          >> a.atom_x
          >> a.atom_y
          >> a.atom_z) {
        i.ignore(256, '\n'); // Discard rest
    }

    return i;
}
// Overloaded insertion operator
std::ostream& operator<<(std::ostream& o, const Atom& a)
{
    o << a.atom_num << " "
      << a.atom_sym << " "
      << std::setprecision(3) << a.atom_x << " "
      << std::setprecision(3) << a.atom_y << " "
      << std::setprecision(3) << a.atom_z;

    return o;
}

int main()
{
    std::string filename = "textfile.pdb";
    std::ifstream file(filename);

    std::vector<Atom> atomList;

    if (file) {
        std::string line;
        while (std::getline(file, line)) {
            if (line.find("ATOM") == 0) {
                std::stringstream ss(line);
                Atom temp;
                if (ss >> temp) {
                    atomList.push_back(temp);
                }
            }
        }
    }

    if (atomList.size() > 10) {
        std::cout << atomList[10] << '\n';
    }

    return 0;
}
...