Как я могу организовать каждый очищенный элемент в строку CSV? - PullRequest
1 голос
/ 03 декабря 2009

Каков наилучший способ организовать очищенные данные в CSV? Точнее, каждый предмет находится в этой форме

url
"firstName middleInitial, lastName - level - word1 word2 word3, & wordN practice officeCity."
JD, schoolName, date

Пример:

http://www.examplefirm.com/jang
"Joe E. Ang - partner - privatization mergers, media & technology practice New York."
JD, University of Chicago Law School, 1985

Я хочу поставить этот элемент в этой форме:

(http://www.examplefirm.com/jang, Joe, E., Ang, partner, privatization mergers, media & technology, New York, University of Chicago Law School, 1985)

чтобы я мог записать его в файл csv для импорта в django db.

Каков наилучший способ сделать это?

Спасибо.

1 Ответ

2 голосов
/ 03 декабря 2009

Там действительно нет короткого пути по этому вопросу. Линия 1 проста. Просто назначьте его на url. Строка 3, вероятно, может быть разбита на , без каких-либо побочных эффектов, но строку 2 придется анализировать вручную. Что вы знаете о word1-wordN? Вы уверены, что «практика» никогда не будет «словом». Вы уверены, что слова только одно слово? Можно ли их процитировать? Могут ли они содержать тире?

Тогда я бы проанализировал начальные и конечные биты, чтобы у вас остался список слов, разделив его запятыми и / или & amp; (есть ли перед запятой одинаковая запятая? Ваш формат говорит, что да, но ваш пример говорит, что нет.) Если есть переменное количество слов, вы не хотите включать их в свой кортеж, как это, потому что вы не знаю, как их вытащить. Создайте список из ваших слов и добавьте его как один элемент кортежа.

>>> tup = (url, first, middle, last, rank, words, city, school, year)
>>> tup
('http://www.examplefirm.com/jang', 'Joe', 'E.', 'Ang', 'partner', 
['privatization mergers', 'media & technology'], 'New York', 
'University of Chicago Law School', '1985')

Более конкретно? Вы там одни.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...