Я новичок в программировании и обучении, но не могу достичь того, чего хочу. Это сценарий:
XXXXXXXXXXXXXXXXXXXX
"Name"
XXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXX
"Casing"
....................
....................
....................
....................
....................
"Tubing" or "Liner"
XXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXX
основная цель состоит в том, чтобы извлечь информацию о корпусе из файла PDF, поэтому, поскольку im new, я извлек весь текст и поместил в лист Excel, так что вот где необходимость help
- я хочу стереть строки и просто сохранить строки информации «Name» и «Casing»
- мои шаги, которые я сделал с моим кодом, потребуют немного времени, чтобы сделать это только для 1 pdf , поэтому я думаю, что могу ускорить процесс, просто извлекая строки, которые я хочу из pdf, но не мог этого сделать, возможно, это лучший вариант
, так что вот мой код:
import pdfplumber
chieve = (r"C:\Users\------------------------------------------------------.pdf")
with pdfplumber.open(chieve) as pdf:
page = pdf.pages[0]
text = page.extract_text().splitlines()
#print(text)
import xlwings as xw
wb = xw.Book()
wb.save('test3.xlsx')
ws1 = wb.sheets[0]
ws1.range('A1').options(transpose = True).value = text
Спасибо за помощь