Question

Я хочу, чтобы моя функция Python разделяла предложение (ввод) и сохраняла каждое слово в списке. Мой текущий код разбивает предложение, но не хранит слова в виде списка. Как мне это сделать?

def split_line(text):

    # split the text
    words = text.split()

    # for each word in the line:
    for word in words:

        # print the word
        print(words)

nstehr · Answer 1 · 13 апреля 2009

text.split()

Этого должно быть достаточно для сохранения каждого слова в списке. words - это уже список слов из предложения, поэтому цикл не нужен.

Во-вторых, это может быть опечатка, но у вас немного испортился цикл. Если вы действительно хотите использовать append, это будет:

words.append(word)

не

word.append(words)

zalew · Answer 2 · 13 апреля 2009

Разбивает строку в text при любых последовательных пробелах.

words = text.split()

Разделить строку на text по разделителю: ",".

words = text.split(",")

Переменная слов будет list и будет содержать слова из text, разделенные на разделитель.

gimel · Answer 3 · 13 апреля 2009

str.split ()

Возвращает список слов в строке, используя sep в качестве разделителя. ... Если sep не указан или None, применяется другой алгоритм разделения: серии последовательных пробелов рассматриваются как один разделитель, и результат не будет содержать пустых строк в начале или конце, если строка имеет начальный или конечный пробельные.

>>> line="a sentence with a few words"
>>> line.split()
['a', 'sentence', 'with', 'a', 'few', 'words']
>>>

tgray · Answer 4 · 13 апреля 2009

В зависимости от того, что вы планируете делать со своим предложением в виде списка, вы можете захотеть взглянуть на Natural Language Took Kit . Это имеет дело с обработкой текста и оценкой. Вы также можете использовать его для решения вашей проблемы:

import nltk
words = nltk.word_tokenize(raw_sentence)

Это имеет дополнительное преимущество разделения пунктуации.

Пример:

>>> import nltk
>>> s = "The fox's foot grazed the sleeping dog, waking it."
>>> words = nltk.word_tokenize(s)
>>> words
['The', 'fox', "'s", 'foot', 'grazed', 'the', 'sleeping', 'dog', ',', 
'waking', 'it', '.']

Это позволяет отфильтровывать любые знаки препинания, которые вам не нужны, и использовать только слова.

Обратите внимание, что другие решения, использующие string.split(), лучше, если вы не планируете выполнять какие-либо сложные манипуляции с предложением.

[Изменено]

Colonel Panic · Answer 5 · 30 июля 2013

Как насчет этого алгоритма? Разделите текст на пустое место, затем обрежьте знаки препинания. Это тщательно удаляет пунктуацию с края слов, не нанося вреда апострофам внутри слов, таких как we're.

>>> text
"'Oh, you can't help that,' said the Cat: 'we're all mad here. I'm mad. You're mad.'"

>>> text.split()
["'Oh,", 'you', "can't", 'help', "that,'", 'said', 'the', 'Cat:', "'we're", 'all', 'mad', 'here.', "I'm", 'mad.', "You're", "mad.'"]

>>> import string
>>> [word.strip(string.punctuation) for word in text.split()]
['Oh', 'you', "can't", 'help', 'that', 'said', 'the', 'Cat', "we're", 'all', 'mad', 'here', "I'm", 'mad', "You're", 'mad']

dbr · Answer 6 · 13 апреля 2009

Я хочу, чтобы моя функция python разделяла предложение (вход) и сохраняла каждое слово в списке

Метод str().split() делает это, он берет строку, разбивает ее на список:

>>> the_string = "this is a sentence"
>>> words = the_string.split(" ")
>>> print(words)
['this', 'is', 'a', 'sentence']
>>> type(words)
<type 'list'> # or <class 'list'> in Python 3.0

Ваша проблема в том, что из-за опечатки вы написали print(words) вместо print(word):

Переименование переменной word в current_word, вот что у вас было:

def split_line(text):
    words = text.split()
    for current_word in words:
        print(words)

.. когда вы должны были сделать:

def split_line(text):
    words = text.split()
    for current_word in words:
        print(current_word)

Если по какой-то причине вы хотите вручную создать список в цикле for, вы должны использовать метод list append(), возможно, потому что вы хотите использовать строчные буквы для всех слов (например):

my_list = [] # make empty list
for current_word in words:
    my_list.append(current_word.lower())

Или более аккуратно, используя список-понимание :

my_list = [current_word.lower() for current_word in words]

Tarwin · Answer 7 · 28 ноября 2013

шлекс имеет функцию .split(). Он отличается от str.split() тем, что не сохраняет кавычки и обрабатывает цитируемую фразу как одно слово:

>>> import shlex
>>> shlex.split("sudo echo 'foo && bar'")
['sudo', 'echo', 'foo && bar']

BlackBeard · Answer 8 · 24 октября 2018

Если вы хотите, чтобы все символы слова / предложения в списке, делали это:

print(list("word"))
#  ['w', 'o', 'r', 'd']


print(list("some sentence"))
#  ['s', 'o', 'm', 'e', ' ', 's', 'e', 'n', 't', 'e', 'n', 'c', 'e']

Aditya Mukherji · Answer 9 · 13 апреля 2009

Я думаю, что вы запутались из-за опечатки.

Замените print(words) на print(word) внутри цикла, чтобы каждое слово печаталось на отдельной строке

Как разбить строку в список?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как разбить строку в список?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы