Мне вручили таблицу с 18000 строками. Каждая запись описывает местоположение одного клиента. Проблема заключается в том, что когда человек создал таблицу, он не добавил поле для «Название компании», только «Имя местоположения», и одна компания может иметь много местоположений.
Например, вот несколько записей, описывающих одного и того же клиента:
Таблица местоположения
ID Location_Name
1 TownShop#1
2 Town Shop - Loc 2
3 The Town Shop
4 TTS - Someplace
5 Town Shop,the 3
6 Toen Shop4
Моя цель сделать так, чтобы это выглядело так:
Таблица местоположения
ID Company_ID Location_Name
1 1 Town Shop#1
2 1 Town Shop - Loc 2
3 1 The Town Shop
4 1 TTS - Someplace
5 1 Town Shop,the 3
6 1 Toen Shop4
Стол компании
Company_ID Company_Name
1 The Town Shop
Нет таблицы «Компания», мне нужно будет составить список названий компаний из наиболее описательного или лучшего названия местоположения, которое представляет несколько местоположений.
В настоящее время я думаю, что мне нужно сгенерировать список имен локаций, которые похожи, а затем и вручную просмотреть этот список.
Любые предложения о том, как я могу подойти к этому, приветствуются.
@ Neall, Спасибо за ваше заявление, но, к сожалению, каждое название местоположения отличается, повторяющихся названий нет, только похожие. Таким образом, в результатах вашего утверждения "repcount" равен 1 в каждой строке.
@ yukondude, Ваш шаг 4 - это суть моего вопроса.