Мои данные исследований имеют переменные столбцы.Каждая строка имеет хотя бы одну метку / ключевое слово, например, «PRMRYTGT» и / или «SBSDRYTGT».Ниже приведен пример данных.
0 PRMRYTGT 16655 O 16657 H 0,991 16656 H 1,053
1 PRMRYTGT 16655 O 16657 H 1,013 16656 H 1,093
2 PRMRYTGT 16655O 16657 H 0,931 16656 H 1,148 SBSDRYTGT 16656 H 15821 O 1,407 SBSDRYTGT 15821 O 16656 H 1,440 15823 H 1,370 15822 H 1,019
3 PRMRYTGT 16655 O 16657 H 1,052 16656 H 1,368 16653 H 1,300 16113 H 6800 SSBSDRYTGT 15821 О 16656 Н 1,137 15822 Н 0,980
4 PRMRYTGT 16655 О 16657 Н 0,881 15747 Н 1,491 SBSDRYTGT 15747 Н 15746 О 1,116 SBSDRYTGT 15746 О 15748 Н 1,003 15747 Н 1,116 5 PRMRYTGT 16655 О 16657 Н 1,018 16113 Н 1,459SBSDRYTGT 16113 H 16112 O 1.161 SBSDRYTGT 16112 O 16114 H 1.017
6 PRMRYTGT 16655 O 16657 H 0.926 16656 H 1.369 SBSDRYTGT 16656 H 15821 O 1.103 * S * SDRYTGT 158 1 H0 10 158 1 158 154 H 151 218 H 1521 158 021 10 158 158 H 1521 158 158 021 10 156 158 158 H 1521PRMRYTGT 16655 O 16657 H 0,960 16656 H 1,35 SBSDRYTGT 16656 H 15821 O 1,087 SBSDRYTGT 15821 O 16656 H 1,087 15822 H 1,060
8 PRMRYTGT 16655 O 16657 H 0,969 16656 H 1,333 SBSDRYTGT 16656 H 15821 O 1,120 SBSDRYTGT 15821 O 16656 H 1,120 15822 H 0,955
9 PRMRYTGT 16655 O 16657 H 0,951
65 1655 H0 0550 668 055 055 055 055 055 055 655 055 055 055 055 055 055 055 055 655 055 055H 1.354 SBSDRYTGT 16113 H 16112 O 1.193 SBSDRYTGT 16112 O 16114 H 0.983
11 PRMRYTGT 16655 O 16657 H 0.966 16113 H 1.204 SBSDRYTGT 16113 H 16112 * 1.11 10 * 1024 10 10 10 10 10 10 10 10 T* Согласно исследовательским запросам, я хочу отобразить контент между ключевыми словами PRMRYTGT и 1-м SBSDRYTGT, а затем показать данные после 1-го SBSDRYTGT.Переменные столбцы затрудняют отображение данных.Есть ли ЭФФЕКТИВНО для извлечения данных?Опять же, эффективный способ, пожалуйста.Мои данные занимают до 10 ГБ, а мой анализ - до 20 дней.Я хочу, чтобы результаты выглядели так:
0 PRMRYTGT 16655 O 16657 H 0,991 16656 H 1,053
1 PRMRYTGT 16655 O 16657 H 1,013 16656 H 1,093
2 PRMRYTGT16655 O 16657 H 0,931 16656 H 1,148
3 PRMRYTGT 16655 O 16657 H 1,052 16656 H 1,300 16113 H 1,468
4 PRMRYTGT 16655 O 16657 H 0,881 15747 H 1.491 SBSDRYTGT 15747 15747 1571038 *
......
и
2 SBSDRYTGT 16656 H 15821 O 1.407 SBSDRYTGT 15821 O 16656 H 1.407 15823 H 1.370 15822 H 1.019
3 SBSDRYTGT 16656 H 15821 O 1,137 SBSDRYTGT 15821 O 16656 H 1,137 15822 H 0,980
4 SBSDRYTGT 15747 H 15746 O 1,116 SBSDRYTGT 15746 O 15748 H 1,100 * 10 * 50 * 15 * 157471052 * Любая помощь будет принята с благодарностью.