как получить строки с условиями? с xlwings или pdfplumber - PullRequest
0 голосов
/ 06 августа 2020

Я новичок в программировании и обучении, но не могу достичь того, чего хочу. Это сценарий:

XXXXXXXXXXXXXXXXXXXX
"Name"
XXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXX
"Casing"
....................
....................
....................
....................
....................
"Tubing" or "Liner"
XXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXX

основная цель состоит в том, чтобы извлечь информацию о корпусе из файла PDF, поэтому, поскольку im new, я извлек весь текст и поместил в лист Excel, так что вот где необходимость help

  1. я хочу стереть строки и просто сохранить строки информации «Name» и «Casing»
  2. мои шаги, которые я сделал с моим кодом, потребуют немного времени, чтобы сделать это только для 1 pdf , поэтому я думаю, что могу ускорить процесс, просто извлекая строки, которые я хочу из pdf, но не мог этого сделать, возможно, это лучший вариант

, так что вот мой код:

import pdfplumber
chieve = (r"C:\Users\------------------------------------------------------.pdf")
with pdfplumber.open(chieve) as pdf:
        page = pdf.pages[0]
        text = page.extract_text().splitlines()
#print(text)

import xlwings as xw
wb = xw.Book()
wb.save('test3.xlsx')
ws1 = wb.sheets[0]
ws1.range('A1').options(transpose = True).value = text

Спасибо за помощь

...