То, что вы хотите сделать, очень разрушительно, если вы опубликовали историю другим разработчикам. См. «Восстановление из исходной базы» в документации git rebase
, чтобы узнать о необходимых шагах после восстановления истории.
У вас есть как минимум два варианта: git filter-branch
и интерактивная перебазировка, оба объяснены ниже.
Использование git filter-branch
У меня была похожая проблема с объемными двоичными тестовыми данными из импорта Subversion и я писал о удалении данных из репозитория git .
Скажите, что ваша история с Git:
$ git lola --name-status
* f772d66 (HEAD, master) Login page
| A login.html
* cb14efd Remove DVD-rip
| D oops.iso
* ce36c98 Careless
| A oops.iso
| A other.html
* 5af4522 Admin page
| A admin.html
* e738b63 Index
A index.html
Обратите внимание, что git lola
- это нестандартный, но очень полезный псевдоним. С помощью ключа --name-status
мы можем видеть модификации дерева, связанные с каждым коммитом.
В коммите «Неосторожный» (имя объекта SHA1 - ce36c98) файл oops.iso
представляет собой DVD-рип, случайно добавленный и удаленный в следующем коммите cb14efd. Используя технику, описанную в вышеупомянутом сообщении в блоге, команда для выполнения:
git filter-branch --prune-empty -d /dev/shm/scratch \
--index-filter "git rm --cached -f --ignore-unmatch oops.iso" \
--tag-name-filter cat -- --all
Параметры:
--prune-empty
удаляет коммиты, которые становятся пустыми (, т.е. , не меняйте дерево) в результате операции фильтрации. В типичном случае эта опция создает более чистую историю.
-d
называет временный каталог, который еще не существует, чтобы использовать его для создания отфильтрованной истории. Если вы работаете в современном дистрибутиве Linux, указание дерева в /dev/shm
приведет к более быстрому выполнению .
--index-filter
является основным событием и работает с индексом на каждом шаге в истории. Вы хотите удалить oops.iso
, где бы он ни находился, но он присутствует не во всех коммитах. Команда git rm --cached -f --ignore-unmatch oops.iso
удаляет DVD-рип, когда он присутствует, и не дает сбоя в противном случае.
--tag-name-filter
описывает, как переписать имена тегов. Фильтр cat
является операцией идентификации. Ваш репозиторий, как и в приведенном выше примере, может не содержать тегов, но я включил эту опцию для полной общности.
--
указывает конец параметров для git filter-branch
--all
после --
является сокращением для всех ссылок. Ваш репозиторий, как и в приведенном выше примере, может иметь только одну ссылку (master), но я включил эту опцию для полной общности.
После некоторого сбивания история теперь:
$ git lola --name-status
* 8e0a11c (HEAD, master) Login page
| A login.html
* e45ac59 Careless
| A other.html
| * f772d66 (refs/original/refs/heads/master) Login page
| | A login.html
| * cb14efd Remove DVD-rip
| | D oops.iso
| * ce36c98 Careless
|/
| A oops.iso
| A other.html
* 5af4522 Admin page
| A admin.html
* e738b63 Index
A index.html
Обратите внимание, что новый коммит «Неосторожный» добавляет только other.html
и что коммит «Remove DVD-rip» больше не находится в основной ветке. В ветке, помеченной refs/original/refs/heads/master
, содержатся ваши исходные коммиты на случай, если вы допустили ошибку. Чтобы удалить его, выполните действия, описанные в «Контрольный список для сокращения хранилища».
$ git update-ref -d refs/original/refs/heads/master
$ git reflog expire --expire=now --all
$ git gc --prune=now
Для более простой альтернативы клонируйте репозиторий для удаления ненужных битов.
$ cd ~/src
$ mv repo repo.old
$ git clone file:///home/user/src/repo.old repo
Использование клона URL file:///...
копирует объекты, а не только создает жесткие ссылки.
Теперь ваша история:
$ git lola --name-status
* 8e0a11c (HEAD, master) Login page
| A login.html
* e45ac59 Careless
| A other.html
* 5af4522 Admin page
| A admin.html
* e738b63 Index
A index.html
Имена объектов SHA1 для первых двух коммитов («Индекс» и «Страница администратора») остались прежними, поскольку операция фильтрации не изменила эти коммиты. «Беспечные» потеряли oops.iso
, а «Страница входа» получила нового родителя, поэтому их SHA1s изменили .
Интерактивная перебазировка
С историей:
$ git lola --name-status
* f772d66 (HEAD, master) Login page
| A login.html
* cb14efd Remove DVD-rip
| D oops.iso
* ce36c98 Careless
| A oops.iso
| A other.html
* 5af4522 Admin page
| A admin.html
* e738b63 Index
A index.html
вы хотите удалить oops.iso
из «Неосторожного», как если бы вы его никогда не добавляли, и тогда «Удалить DVD-рип» для вас бесполезно. Таким образом, наш план перехода к интерактивной перебазировке состоит в том, чтобы сохранить «Страницу администратора», отредактировать «Неосторожный» и отменить «Удалить DVD-рип».
Запуск $ git rebase -i 5af4522
запускает редактор со следующим содержимым.
pick ce36c98 Careless
pick cb14efd Remove DVD-rip
pick f772d66 Login page
# Rebase 5af4522..f772d66 onto 5af4522
#
# Commands:
# p, pick = use commit
# r, reword = use commit, but edit the commit message
# e, edit = use commit, but stop for amending
# s, squash = use commit, but meld into previous commit
# f, fixup = like "squash", but discard this commit's log message
# x, exec = run command (the rest of the line) using shell
#
# If you remove a line here THAT COMMIT WILL BE LOST.
# However, if you remove everything, the rebase will be aborted.
#
Выполняя наш план, мы изменяем его на
edit ce36c98 Careless
pick f772d66 Login page
# Rebase 5af4522..f772d66 onto 5af4522
# ...
То есть мы удаляем строку с помощью «Remove DVD-rip» и изменяем операцию на «Careless» на edit
вместо pick
.
Сохранение при выходе из редактора приводит нас к командной строке со следующим сообщением.
Stopped at ce36c98... Careless
You can amend the commit now, with
git commit --amend
Once you are satisfied with your changes, run
git rebase --continue
Как говорится в сообщении, мы выполняем коммит «Небрежный», который хотим редактировать, поэтому мы запускаем две команды.
$ git rm --cached oops.iso
$ git commit --amend -C HEAD
$ git rebase --continue
Первый удаляет поврежденный файл из индекса. Второйизменяет или изменяет «Careless» на обновленный индекс, а -C HEAD
дает команду git повторно использовать старое сообщение коммита.Наконец, git rebase --continue
продолжается с остальной частью операции rebase.
Это дает историю:
$ git lola --name-status
* 93174be (HEAD, master) Login page
| A login.html
* a570198 Careless
| A other.html
* 5af4522 Admin page
| A admin.html
* e738b63 Index
A index.html
, что вам нужно.