Там действительно нет короткого пути по этому вопросу. Линия 1 проста. Просто назначьте его на url
. Строка 3, вероятно, может быть разбита на ,
без каких-либо побочных эффектов, но строку 2 придется анализировать вручную. Что вы знаете о word1-wordN? Вы уверены, что «практика» никогда не будет «словом». Вы уверены, что слова только одно слово? Можно ли их процитировать? Могут ли они содержать тире?
Тогда я бы проанализировал начальные и конечные биты, чтобы у вас остался список слов, разделив его запятыми и / или & amp; (есть ли перед запятой одинаковая запятая? Ваш формат говорит, что да, но ваш пример говорит, что нет.) Если есть переменное количество слов, вы не хотите включать их в свой кортеж, как это, потому что вы не знаю, как их вытащить. Создайте список из ваших слов и добавьте его как один элемент кортежа.
>>> tup = (url, first, middle, last, rank, words, city, school, year)
>>> tup
('http://www.examplefirm.com/jang', 'Joe', 'E.', 'Ang', 'partner',
['privatization mergers', 'media & technology'], 'New York',
'University of Chicago Law School', '1985')
Более конкретно? Вы там одни.