Как редко получить только один файл из репозитория git? - PullRequest
395 голосов
/ 18 марта 2010

Как мне оформить заказ на один файл из репозитория git?

Ответы [ 21 ]

5 голосов
/ 08 декабря 2015

Скажите, что имя файла 123.txt, у меня это работает:

git checkout --theirs  123.txt

Если файл находится в каталоге A, обязательно укажите его правильно:

git checkout --theirs  "A/123.txt"
5 голосов

git clone --filter из Git 2.19

Эта опция фактически пропускает выборку большинства ненужных объектов с сервера:

git clone --depth 1 --no-checkout --filter=blob:none \
  "file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/myfile

Сервер должен быть настроен с:

git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1

Начиная с версии v2.19.0 сервер не поддерживается, но его уже можно локально протестировать.

TODO: --filter=blob:none пропускает все BLOB-объекты, но по-прежнему выбирает все объекты дерева. Но в обычном репо это должно быть крошечным по сравнению с самими файлами, так что это уже достаточно хорошо. На вопрос: https://www.spinics.net/lists/git/msg342006.html Разработчики ответили, что --filter=tree:0 готовится к этому.

Помните, что --depth 1 уже подразумевает --single-branch, см. Также: Как мне клонировать одну ветку в Git?

file://$(path) требуется для преодоления git clone протокола shenanigans: Как отменить клонирование локального хранилища git с относительным путем?

Формат --filter задокументирован в man git-rev-list.

Было добавлено расширение для протокола Git remote для поддержки этой функции.

Документы на Git tree:

Проверьте это

#!/usr/bin/env bash
set -eu

list-objects() (
  git rev-list --all --objects
  echo "master commit SHA: $(git log -1 --format="%H")"
  echo "mybranch commit SHA: $(git log -1 --format="%H")"
  git ls-tree master
  git ls-tree mybranch | grep mybranch
  git ls-tree master~ | grep root
)

# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'

rm -rf server_repo local_repo
mkdir server_repo
cd server_repo

# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1

# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet

# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet

# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet

echo "# List and identify all objects"
list-objects
echo

# Restore master.
git checkout --quiet master
cd ..

# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo

# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo

echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo

echo "# Git checkout fetches the missing file from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/a
echo

echo "# Missing objects after checking out d1/a"
git rev-list --all --quiet --objects --missing=print

GitHub upstream .

Вывод в Git v2.19.0:

# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75    d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a    d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3    master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043    mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f    root

# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63

# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.

Please make sure you have the correct access rights
and the repository exists.

# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.

# Missing objects after checking out d1
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb

Выводы: все BLOB-объекты, кроме d1/a, отсутствуют. Например. f70a17f51b7b30fec48a32e4f19ac15e261fd1a4, то есть d1/b, нет после проверки d1/.

Обратите внимание, что root/root и mybranch/mybranch также отсутствуют, но --depth 1 скрывает это из списка отсутствующих файлов. Если вы удалите --depth 1, то они отобразятся в списке отсутствующих файлов.

5 голосов
/ 21 октября 2013

Два варианта того, что уже было дано:

git archive --format=tar --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | tar -O -xf -

и

git archive --format=zip --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | funzip

Они записывают файл в стандартный вывод.

4 голосов
/ 18 марта 2010

В git вы не «извлекаете» файлы, прежде чем обновлять их - кажется, что вы ищете.

Многие системы, такие как clearcase, csv и т. Д., Требуют от вас «извлечения» файла, прежде чем вы сможете внести в него изменения. Git не требует этого. Вы клонируете репозиторий, а затем вносите изменения в локальную копию репозитория.

После обновления файлов вы можете сделать:

git status

Чтобы увидеть, какие файлы были изменены. Сначала вы добавляете те, которые хотите зафиксировать, к index (index походит на список для проверки):

git add .

или

git add blah.c

Затем do git status покажет вам, какие файлы были изменены, а какие в index готовы для принятия или регистрации.

Для фиксации файлов в вашей копии хранилища выполните:

git commit -a -m "commit message here"

См. git веб-сайт для ссылок на руководства и руководства.

2 голосов
/ 03 марта 2019

Вот полное решение для извлечения и загрузки только определенного файла внутри репозитория git:

  1. Сначала вам нужно клонировать git-репозиторий со специальной подсказкой - нет проверки
git clone --no-checkout <git url>
  1. Следующий шаг, который вам нужно выполнить, - это избавиться от неподготовленных файлов в репо с помощью команды:
git reset
  1. Теперь вы можете начать извлекать файлы, которые вы хотите изменить, с помощью команды:
git checkout origin/master <path to file>
  1. Теперь папка репозитория содержит файлы, которые вы можете начать редактировать прямо сейчас. После редактирования вам нужно выполнить простую и знакомую последовательность команд.
git add <path to file>
git commit -m <message text>
git push

Также см. Ссылку для получения дополнительной информации.

1 голос
/ 18 марта 2010

Звучит так, будто вы пытаетесь перенести идею из централизованного контроля версий, которой нет по природе git - она ​​распространяется. Если вы хотите работать с git-репозиторием, вы клонируете его. Затем у вас есть все содержимого рабочего дерева и все истории (ну, по крайней мере, все, что ведет к вершине текущей ветви), а не только один файл или снимок с одного коммита.

 git clone /path/to/repo
 git clone git://url/of/repo
 git clone http://url/of/repo
1 голос
/ 08 июля 2017

Если вам нужен определенный файл из определенной ветки из удаленного репозитория Git, введите команду:

git archive --remote=git://git.example.com/project.git refs/heads/mybranch path/to/myfile |tar xf -

Остальное можно получить из ответа @ VonC:

Если вам нужен определенный файл из основной ветки, это:

git archive --remote=git://git.example.com/project.git HEAD path/to/myfile |tar xf -

Если вам нужен определенный файл из тега, это:

git archive --remote=git://git.example.com/project.git mytag path/to/myfile |tar xf -
0 голосов
/ 18 декабря 2013

Если вам нужно только загрузить файл, нет необходимости проверять его с помощью Git.

GitHub Mate гораздо проще сделать, это расширение Chrome, позволяет щелкнуть значок файла, чтобы загрузить его. также с открытым исходным кодом

0 голосов
/ 10 февраля 2019

Я добавляю этот ответ в качестве альтернативы формальной проверке или какой-либо подобной локальной операции. Предполагая, что у вас есть доступ к веб-интерфейсу вашего провайдера Git, вы можете напрямую просматривать любой файл с заданным желаемым коммитом. Например, на GitHub вы можете использовать что-то вроде:

https://github.com/hubotio/hubot/blob/ed25584f/src/adapter.coffee

Здесь ed25584f - это первые 8 символов из хэша SHA-1 интересующего коммита, за которым следует путь к исходному файлу.

Аналогично, на Bitbucket мы можем попробовать:

https://bitbucket.org/cofarrell/stash-browse-code-plugin/src/06befe08

В этом случае мы помещаем хеш коммита в конец исходного URL.

0 голосов
/ 18 сентября 2018

Я не вижу в списке того, что сработало для меня, поэтому включу его, если кто-нибудь окажется в моей ситуации.

В моей ситуации у меня есть удаленный репозиторий, может быть, 10000 файлов, и мне нужно создать RPM-файл для моей системы Linux. Сборка RPM включает в себя git clone всего. Все, что мне нужно, это один файл для запуска сборки RPM. Я могу клонировать все дерево исходников, которое делает то, что мне нужно, но для загрузки всех этих файлов требуются дополнительные две минуты, когда все, что мне нужно, это один. Я попытался использовать обсуждаемую опцию git archive и получил «фатальный: операция не поддерживается протоколом». Кажется, мне нужно включить какую-то опцию архивирования на сервере, и мой сервер обслуживается бюрократическими головорезами, которые, кажется, любят делать трудно добиться цели.

В конце концов я зашел в веб-интерфейс для bitbucket и просмотрел один нужный мне файл. Я щелкнул правой кнопкой мыши по ссылке, чтобы загрузить сырую копию файла, и выбрал «копировать ярлык» в появившемся всплывающем окне. Я не мог просто загрузить необработанный файл, потому что мне нужно было что-то автоматизировать, и у меня нет интерфейса браузера на моем сервере Linux.

Ради обсуждения, которое привело к URL:

https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest

Я не мог напрямую загрузить этот файл из репозитория bitbucket, потому что мне нужно было сначала войти в систему. Немного покопавшись, я обнаружил, что это сработало: В Linux:

echo "myUser:myPass123"| base64
bXlVc2VyOm15UGFzczEyMwo=

curl -H 'Authorization: Basic bXlVc2VyOm15UGFzczEyMwo=' 'https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest' > bar.spec

Эта комбинация позволила мне загрузить один файл, который мне был нужен для сборки всего остального.

...