Question

У меня есть список кодов продуктов в текстовом файле, на каждом из которых есть код продукта, который выглядит следующим образом:

abcd2343 abw34324 abc3243-23A

Так что это буквы, за которыми следуют цифры и другие символы.

Я хочу разбить первое вхождение числа.

unutbu · Answer 1 · 27 июля 2010

In [32]: import re

In [33]: s='abcd2343 abw34324 abc3243-23A'

In [34]: re.split('(\d+)',s)
Out[34]: ['abcd', '2343', ' abw', '34324', ' abc', '3243', '-', '23', 'A']

Или, если вы хотите разделить первое вхождение цифры:

In [43]: re.findall('\d*\D+',s)
Out[43]: ['abcd', '2343 abw', '34324 abc', '3243-', '23A']

\d+ соответствует 1 или более цифрам.
\d*\D+ соответствует 0 или более цифрам, за которыми следует 1 или более цифр.
\d+|\D+ соответствует 1 или более цифрам или 1-или- больше не цифр.

Обратитесь к в документах за дополнительной информацией о синтаксисе регулярных выражений Python.

re.split(pat, s) разбит строку sиспользуя pat в качестве разделителя.Если pat начинается и заканчивается круглыми скобками (чтобы быть «группой захвата»), тогда re.split вернет также подстроки, совпадающие с pat.Например, сравните:

In [113]: re.split('\d+', s)
Out[113]: ['abcd', ' abw', ' abc', '-', 'A']   # <-- just the non-matching parts

In [114]: re.split('(\d+)', s)
Out[114]: ['abcd', '2343', ' abw', '34324', ' abc', '3243', '-', '23', 'A']  # <-- both the non-matching parts and the captured groups

Напротив, re.findall(pat, s) возвращает только те части s, которые соответствуют pat:

In [115]: re.findall('\d+', s)
Out[115]: ['2343', '34324', '3243', '23']

Таким образом, если s заканчиваетсяс цифрой, вы можете избежать окончания пустой строки, используя re.findall('\d+|\D+', s) вместо re.split('(\d+)', s):

In [118]: s='abcd2343 abw34324 abc3243-23A 123'

In [119]: re.split('(\d+)', s)
Out[119]: ['abcd', '2343', ' abw', '34324', ' abc', '3243', '-', '23', 'A ', '123', '']

In [120]: re.findall('\d+|\D+', s)
Out[120]: ['abcd', '2343', ' abw', '34324', ' abc', '3243', '-', '23', 'A ', '123']

Muhammad Alkarouri · Answer 2 · 27 июля 2010

Разбить на первую цифру

parts = re.split('(\d.*)','abcd2343')      # => ['abcd', '2343', '']
parts = re.split('(\d.*)','abc3243-23A')   # => ['abc', '3243-23A', '']

Таким образом, две части всегда являются частями [0] и частями [1].

Конечно, вы можете применить это к нескольким кодам:

>>> s = "abcd2343 abw34324 abc3243-23A"
>>> results = [re.split('(\d.*)', pcode) for pcode in s.split(' ')]
>>> results
[['abcd', '2343', ''], ['abw', '34324', ''], ['abc', '3243-23A', '']]

Если каждый код находится в отдельной строке, тогда вместо s.split( ) используйте s.splitlines().

jwsample · Answer 3 · 27 июля 2010

import re

m = re.match(r"(?P<letters>[a-zA-Z]+)(?P<the_rest>.+)$",input)

m.group('letters')
m.group('the_rest')

Это охватывает ваш угловой регистр abc3243-23A и выдаст abc для группы букв и 3243-23A для the_rest

Поскольку вы сказали, что они все в отдельных строках, вы 'Очевидно, нужно будет поставить строку за раз в input

Mike · Answer 4 · 27 июля 2010

def firstIntIndex(string):
    result = -1
    for k in range(0, len(string)):
        if (bool(re.match('\d', string[k]))):
            result = k
            break
    return result

Код товара выглядит как abcd2343, что разделить на буквы и цифры

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Код товара выглядит как abcd2343, что разделить на буквы и цифры

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов