Используйте MySQL для исправления существующих:
UPDATE table SET URL=REPLACE(URL,'http://imdb.com','http://www.imdb.com') WHERE URL LIKE 'http://imdb.com/%';
Затем заранее используйте PHP для исправления входящих URL-адресов:
$url = str_replace('http://imdb.com','http://www.imdb.com',$url);
Но лучший способ - это сохранить идентификатор фильма imdb.com в своей базе данных:
http://www.imdb.com/title/tt0088846/
Вместо этого сохраните "tt0088846" или, что еще лучше, 88846 в качестве первичного ключа и используйте константу:
$imdb_url = "http://www.imdb.com/title/tt{ID}/";
$url = str_replace("{ID}", $movie_id, $imdb_url);
Таким образом, намного быстрее и проще обнаруживать дубликаты. Обратите внимание, что IMDB имеет разные типы медиа (актеры и т. Д.), Которые используют другой префикс (nm для актеров и т. Д.), Поэтому имейте это в виду при проектировании базы данных.