Regex для поиска имени из абзаца в python - PullRequest
0 голосов
/ 19 июня 2020

Я использую способ регулярного выражения, чтобы найти имя и адрес в счете,

Я пробовал следующие шаблоны регулярных выражений

^([A-Za-z])+$
^[A-Za-z]+(((\'|\-|\.)?([A-Za-z])+))?$
^[A-Za-z]+((\s)?((\'|\-|\.)?([A-Za-z])+))*$
^[A-Za-z]+((\s)?([A-Za-z])+)*$

если не регулярное выражение, есть ли другой способ найти имя и адрес клиента в этих данных

заранее спасибо.

данные счета указаны ниже

09/06/2020 Browntape.com | Orders | HtmlInvoice

Original for Receipient

Duplicate for Supplier/Transporter


TAX INVOICE Triplicate for Supplier

ITU TAMAA i

38826532-601 1257816 MLO380675700
comapy
GSTIN 1 29145AKCA223551ZK Invoice Date : 8 Jun 2020
Branch : Karnataka Invoice No. : SSINV/17-18/0887480
PAN =NA Reference No. : 38826532-601 1257816
Place of Supply AS Payment Type : PAID
Customer Name Billing Address Shipping Address
Saswati Saswati Saswati

Addreesss, Addreesss,
Customer GSTIN Khanamukh , Guwahati, AS, India, 781014 Khanamukh , Guwahati, AS, India, 781014
Ph: 1234567890 Ph: 1234567890

Pre-Tax Pre-Tax| pre-tax Taxable

Unit Unit -,
Discount| Shipping Oni NR tans

(INR) (INR)

Desc. of Goods

Z|1880COREABLUE032DD
(ZI1880COREABLUE032DD) 42.86 384.76


42.86 0 384.76


Taxable Amount

Total Tax
Invoice Total
Invoice Total(In Words) | INR Four Hundred and Four
We hope that you like the iterns that you have received. If there is anything about your products that you
are not happy with, please let us know using the contact details below and we will be happy to help you.
For Milastar Retail Pvt Ltd Authorised
We would be grateful for your positive feedback about our service. Signatory
Thank you for your business, we hope to see you again soon!
Warehouse Address: company, Warehouse no 2,
Company Address: company, Karnataka, addreess,
Karnataka, 562123, India, manjunath@zivame.com, company
app.browntape.com/orders/html_invoice/5561154968 Vi

Мой ожидаемый результат:

Saswati Address: Khanamukh , Guwahati, AS, India, 781014 Khanamukh , Guwahati, AS, India, 781014

1 Ответ

0 голосов
/ 19 июня 2020

Customer [A-Z]*\s(([\w\s]+,)*([\d\s]+)) захватывает этот конкретный пример, но может потребоваться настроить. Захваченный текст можно дополнительно обработать в Python с помощью метода group ().

...