У меня есть таблица Excel, содержащая стенограммы различных телевизионных шоу.Как вы можете видеть, каждый раз при смене динамика они обозначаются как «BURNETT:» или «HANNITY:».Мне нужен способ объединить все ячейки, которые следуют за конкретным оратором, чтобы их речь содержалась в одной ячейке Excel.Я попытался сохранить текст в столбцы как CSV и выполнить поиск-замену, но, конечно, это не сработало.
Например, мне нужно это ...
NETWORK SHOW DATE TIME TIMEBLOCK SPEAKER SPEAKTURN
CNN OUTFRONT 2011-12-05 19:00 19:00 ERIN BURNETT OUTFRONT
CNN OUTFRONT 2011-12-05 19:00 19:00 ERIN BURNETT, HOST: Thanks, John. We're live from the Middle East…
CNN OUTFRONT 2011-12-05 19:00 19:00 Let's go OUTFRONT.
CNN OUTFRONT 2011-12-05 19:00 19:00 I'm Erin Burnett and I'm OUTFRONT tonight live from Abu Dhabi in…
CNN OUTFRONT 2011-12-05 19:00 19:00 Now Iran claims that it shot down an American drone that looks a…
CNN OUTFRONT 2011-12-05 19:00 19:00 If this really happened, that means that technology is in the han…
CNN OUTFRONT 2011-12-05 19:00 19:00 So far recently we've had Israel threatening to bomb Iranian nucl…
CNN OUTFRONT 2011-12-05 19:00 19:00 Iran is defiant, and a defiant Iran could mean surging oil prices…
CNN OUTFRONT 2011-12-05 19:00 19:00 Robin Mills is author of "The Myth of the Oil Crisis". Riad Kahwa…
CNN OUTFRONT 2011-12-05 19:00 19:00 RIAD KAHWAJI, FOUNDER, INST. MILITARY ANALYSIS: Well, I think…
CNN OUTFRONT 2011-12-05 19:00 19:00 BURNETT: Teetering.
Чтобы стать этим ...
NETWORK SHOW DATE TIME TIMEBLOCK SPEAKER SPEAKTURN
CNN OUTFRONT 2011-12-05 19:00 19:00 ERIN BURNETT OUTFRONT
CNN OUTFRONT 2011-12-05 19:00 19:00 ERIN BURNETT, HOST: Thanks, John. <<all the intervening text in the rows in between>> Robin Mills is author of "The Myth of the Oil Crisis." Riad Kahwa…
CNN OUTFRONT 2011-12-05 19:00 19:00 RIAD KAHWAJI, FOUNDER, INST. MILITARY ANALYSIS: Well, I think…
CNN OUTFRONT 2011-12-05 19:00 19:00 BURNETT: Teetering.
Посмотрите, как говорящий ход Эрин Бернетт теперь содержится в одной ячейке, а другие строки были удалены?Мне нужен макрос, который делает это.
Оттуда я могу заставить его выглядеть так, используя функцию преобразования текста в столбцы и удаляя все строки, которые не имеют имени в столбце SPEAKER.Это было бы конечной целью, но я могу сделать эти шаги (да, я знаю, оставив вам сложную часть).
NETWORK SHOW DATE TIME TIMEBLOCK SPEAKER SPEAKTURN
CNN OUTFRONT 2011-12-05 19:00 19:00 ERIN BURNETT, HOST Thanks, John. <<intervening text>> Robin Mills is author of "The Myth of the Oil Crisis." Riad Kahwa…
CNN OUTFRONT 2011-12-05 19:00 19:00 RIAD KAHWAJI, FOUNDER, INST. FOR MILITARY ANALYSIS Well, I think…
CNN OUTFRONT 2011-12-05 19:00 19:00 BURNETT Teetering.
Рабочий лист, если вы этого хотите, доступен здесь на Wikisend на следующую неделю.
Для чего бы то ни было, я уверен, что любой сценарий, который распознает ячейку как вводящего нового спикера, должен просто видеть, что по крайней мере четыре последовательных капиталабуквы в конце концов следовали за двоеточием (я говорю, в конце концов, из-за названий и профессий, данных в первый раз, когда они говорят).Затем он может смотреть вниз по столбцу, пока не найдет другую такую ячейку.Затем он объединит содержимое (вставляя пробелы между каждой) всех ячеек между «найденными» ячейками и удалит строки, в которых больше нет данных SPEAKTURN.
Наконец, я должен извиниться.Я знаю, что от Stackoverflow ожидают, что я проведу обширные исследования, но я подхожу к крайнему сроку и не знаю, куда еще обратиться.Я узнал, как спотыкаться на своем пути через R в течение месяца в прошлом семестре, но, как политолог, главный выход из моей лиги, я не могу за всю жизнь выучить достаточно VBA, чтобы сделать это ко вторнику.:: опустив голову в стыде ::
Без макроса, чтобы сделать это, мне придется потратить несколько дней, объединяя более 8000 ячеек.Я в отчаянии.Если вы хотите получить компенсацию - я плохой выпускник колледжа и пытаюсь сделать проект для старших по связям - я сделаю все возможное.Я просто нахожусь в своем уме.
PS Если вы хотите знать, зачем мне это нужно ... ХОРОШО, я буду оценивать каждый из выступающих за наличие или отсутствие 13 типов манипуляций.Тактика ведущими телешоу: (1) оскорбительный язык, (2) называние имени, (3) эмоциональные проявления, (4) эмоциональный язык, (5) словесные драки / спарринг, (6) убийство персонажа, (7) искаженное преувеличение,(8) издевательство / сарказм, (9) конфликт, (10) идеологически экстремизирующий язык, (11) аргументы скользкого склона, (12) принижение и (13) нецензурная лексика.Это все о том, как кабельные новостные шоу раздражают людей.8000 строк этого займут некоторое время, поэтому я так отчаянно нуждаюсь в вашей помощи.