#VENDOR FACTORY DELIVERY ADDRESS
#Vendor Number : 123 XYZ Distribution Centre
#Company Name Edison
#Sample Road Oak Center Pkwy
#Sample City, 123 CityName
#Sample City, 1213 StateName NJ 123-456
#StateName CountryName USA
#India Pincode
#PURCHASE BY / ULTIMATE CONSIGNEE PO Raised Date 22/08/2018
Это данные, которые у меня есть, PDFPlumber выделяет их в отдельные строки, как это, я хочу, чтобы они выбирали данные только после 123 XYZ, Название компании, Образец дороги, 123, StateName, CountryName, India. А затем объединить эти данные, разделяя все запятой (чтобы потом поместить ее в таблицу Excel, используя pandas) [Поскольку этот материал одинаков для каждого документа]
, и я хочу, чтобы он прекратил сбор данных после того, как он попадает в строку со словами «ПОКУПАТЬ ПОЛЬЗОВАТЕЛЕМ / ULTIMATE»
Есть ли способ достичь этого (я использую модули pdfplumber, regex, namedtuple из коллекций и pandas). Пожалуйста, помогите мне здесь.