¿Cómo pago solo un archivo de un repositorio de git?
¿Cómo pago solo un archivo de un repositorio de git?
Respuestas:
Originalmente, he mencionado en el año 2012 git archive
(ver Jared Forsyth 's respuesta y Robert Knight ' s respuesta ), ya que git1.7.9.5 (marzo de 2012) , Paul Brannan 's respuesta :
git archive --format=tar --remote=origin HEAD:path/to/directory -- filename | tar -O -xf -
Pero: en 2013, eso ya no era posible para las URL https://github.com remotas .
Consulte la página anterior " ¿Puedo archivar un repositorio? "
La página actual (2018) " Acerca del archivo de contenido y datos en GitHub " recomienda el uso de servicios de terceros como GHTorrent o GH Archive .
Por lo tanto, también puede manejar copias locales / clonar:
Alternativamente, puede hacer lo siguiente si tiene una copia local del repositorio simple como se menciona en esta respuesta ,
git --no-pager --git-dir /path/to/bar/repo.git show branch:path/to/file >file
O debe clonar primero el repositorio, lo que significa que obtendrá el historial completo: - en el repositorio .git - en el árbol de trabajo.
git config core.sparsecheckout true
).git/info/sparse-checkout
archivoPara volver a leer el árbol de trabajo:
$ git read-tree -m -u HEAD
De esa manera, terminas con un árbol de trabajo que incluye exactamente lo que quieres (incluso si es solo un archivo)
Richard Gomes señala ( en los comentarios ) a " ¿Cómo clono, obtengo o escaso el pago de un único directorio o una lista de directorios del repositorio de git? "
Una función bash que evita la descarga del historial, que recupera una sola rama y que recupera una lista de archivos o directorios que necesita.
git archive
ahora.
Primero clone el repositorio con la opción -n, que suprime el pago predeterminado de todos los archivos, y la opción --depth 1, lo que significa que solo obtiene la revisión más reciente de cada archivo
git clone -n git://path/to/the_repo.git --depth 1
Luego revisa solo el archivo que deseas, así:
cd the_repo
git checkout HEAD name_of_file
-n
el árbol de trabajo y el índice terminan sincronizados. Es decir, todo el contenido aparece como eliminado. Tienes que cualquiera git reset HEAD
o git checkout HEAD file
. También es realmente difícil trabajar con el repositorio en este punto a menos que realmente entiendas cómo funciona git.
rm -rf .git
al guión de NickMoore limpiaría todos los rastros del repositorio clonado y tal vez calmaría la preocupación de Jefromi por tener un repositorio difícil de usar. Me resulta muy útil para varias aplicaciones, como mi desafío hoy para construir un gancho posterior a la recepción para actualizar la versión de otro gancho posterior a la recepción de forma automática.
git
no es la mejor para este tipo de trabajo). Esta respuesta también es válida para esta pregunta , o esta otra popular , y muchas otras: cambie name_of_file
a name_of_folder
. Git in today (2014s) ofrece submódulos para el propietario del repositorio y ofrece algunos por amigables para los usuarios del repositorio.
Si ya tiene una copia del repositorio de git, siempre puede retirar una versión de un archivo usando a git log
para averiguar el hash-id (por ejemplo, 3cdc61015724f9965575ba954c8cd4232c8b42e4) y luego simplemente escriba:
git checkout hash-id path-to-file
Aquí hay un ejemplo real:
git checkout 3cdc61015724f9965575ba954c8cd4232c8b42e4 /var/www/css/page.css
path-to-file
es un directorio, y actual HEAD
contiene cierto archivo mientras target
que no lo hace (o viceversa), esto no actualizará correctamente el archivo. ¿Hay alguna forma de manejarlo?
Normalmente no es posible descargar solo un archivo git
sin descargar todo el repositorio como se sugiere en la primera respuesta. Esto se debe a que Git no almacena archivos como usted piensa (como lo hace CVS / SVN), sino que los genera en función del historial completo del proyecto.
Pero hay algunas soluciones para casos específicos. Ejemplos a continuación con marcadores de posición para user
, project
, branch
, filename
.
GitHub
wget https://raw.githubusercontent.com/user/project/branch/filename
GitLab
wget https://gitlab.com/user/project/raw/branch/filename
GitWeb
Si está utilizando Git en el servidor - GitWeb , puede intentarlo con un ejemplo (cámbielo a la ruta correcta):
wget "http://example.com/gitweb/?p=example;a=blob_plain;f=README.txt;hb=HEAD"
GitWeb en drupalcode.org
Ejemplo:
wget "http://drupalcode.org/project/ads.git/blob_plain/refs/heads/master:/README.md"
googlesource.com
Hay una función no documentada que le permite descargar versiones codificadas en base64 de archivos sin formato:
curl "https://chromium.googlesource.com/chromium/src/net/+/master/http/transport_security_state_static.json?format=TEXT" | base64 --decode
En otros casos, verifique si su repositorio Git está utilizando alguna interfaz web.
Si no está usando cualquier interfaz web, usted puede considerar para empujar su código a los servicios externos tales como GitHub , Bitbucket , etc . y úsalo como espejo.
Si no tiene wget
instalado, intente curl -O (url)
alternativamente.
wget
respuesta brillante y la simplicidad regresa, junto con la felicidad. Gracias hombre.
git checkout branch_or_version - ruta / archivo
ejemplo: git checkout HEAD -- main.c
git checkout -- <filename>
Ref: https://git-scm.com/docs/git-checkout
Dup: ¿ Deshacer modificaciones de copia de trabajo de un archivo en Git?
git-checkout
.
¡Ahora podemos! Como este es el primer resultado en Google, pensé en actualizarlo a la última posición. Con el advenimiento de git 1.7.9.5, tenemos el git archive
comando que le permitirá recuperar un solo archivo desde un host remoto.
git archive --remote=git://git.foo.com/project.git HEAD:path/in/repo filename | tar -x
Vea la respuesta completa aquí https://stackoverflow.com/a/5324532/290784
github.com
HEAD
o master
no HEAD:directory
.
git archive --remote=git@bitbucket.org:user/repo branch:path/to file | tar -x
Trabajando en GIT 1.7.2.2
Por ejemplo, tiene un control remoto remoto con ramas branch1 , branch32
así que para pagar un archivo específico llama a estos comandos
git checkout remote/branch path/to/file
como ejemplo será algo como esto
git checkout some_remote/branch32 conf/en/myscript.conf
git checkout some_remote/branch1 conf/fr/load.wav
Este comando de pago copiará toda la estructura de archivos conf / en y conf / fr en el directorio actual donde llame a estos comandos (por supuesto, supongo que ejecutó git init en algún momento antes)
git fetch some_remote
antes, ¿no?
Muy simple:
git checkout from-branch-name -- path/to/the/file/you/want
Esto no pagará la from-branch-name
sucursal. Permanecerá en la rama en la que se encuentre, y solo ese archivo único se extraerá de la rama especificada.
Aquí está la parte relevante de la página de manual para git-checkout
git checkout [-p|--patch] [<tree-ish>] [--] <pathspec>...
When <paths> or --patch are given, git checkout does not switch
branches. It updates the named paths in the working tree from the
index file or from a named <tree-ish> (most often a commit). In
this case, the -b and --track options are meaningless and giving
either of them results in an error. The <tree-ish> argument can be
used to specify a specific tree-ish (i.e. commit, tag or tree) to
update the index for the given paths before updating the working
tree.
Un consejo para Ariejan de Vroom, quien me enseñó esto en esta publicación de blog .
git clone --filter
de Git 2.19
Esta opción realmente omitirá la búsqueda de la mayoría de los objetos innecesarios del servidor:
git clone --depth 1 --no-checkout --filter=blob:none \
"file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/myfile
El servidor debe configurarse con:
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
No hay soporte de servidor a partir de v2.19.0, pero ya se puede probar localmente.
TODO: --filter=blob:none
omite todos los blobs, pero aún recupera todos los objetos del árbol. Pero en un repositorio normal, esto debería ser pequeño en comparación con los archivos en sí, por lo que esto ya es lo suficientemente bueno. Preguntado en: https://www.spinics.net/lists/git/msg342006.html Los desarrolladores respondieron que se --filter=tree:0
está trabajando para hacerlo.
Recuerde que eso --depth 1
ya implica --single-branch
, vea también: ¿Cómo clono una sola rama en Git?
file://$(path)
se requiere para superar las git clone
travesuras de protocolo: ¿Cómo clonar superficialmente un repositorio git local con una ruta relativa?
El formato de --filter
está documentado en man git-rev-list
.
Se realizó una extensión al protocolo remoto Git para admitir esta función.
Documentos en el árbol de Git:
Pruébalo
#!/usr/bin/env bash
set -eu
list-objects() (
git rev-list --all --objects
echo "master commit SHA: $(git log -1 --format="%H")"
echo "mybranch commit SHA: $(git log -1 --format="%H")"
git ls-tree master
git ls-tree mybranch | grep mybranch
git ls-tree master~ | grep root
)
# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'
rm -rf server_repo local_repo
mkdir server_repo
cd server_repo
# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet
# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet
# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet
echo "# List and identify all objects"
list-objects
echo
# Restore master.
git checkout --quiet master
cd ..
# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo
# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo
echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo
echo "# Git checkout fetches the missing file from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/a
echo
echo "# Missing objects after checking out d1/a"
git rev-list --all --quiet --objects --missing=print
Salida en Git v2.19.0:
# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f root
# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63
# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.
Please make sure you have the correct access rights
and the repository exists.
# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
# Missing objects after checking out d1
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
Conclusiones: d1/a
faltan todos los blobs excepto . Por ejemplo f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
, que d1/b
no está allí después de salir d1/
.
Tenga en cuenta que root/root
y mybranch/mybranch
también faltan, pero lo --depth 1
oculta de la lista de archivos faltantes. Si elimina --depth 1
, se muestran en la lista de archivos faltantes.
Puedes hacerlo por
git archive --format=tar --remote=origin HEAD | tar xf -
git archive --format=tar --remote=origin HEAD <file> | tar xf -
Dos variantes de lo que ya se ha dado:
git archive --format=tar --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | tar -O -xf -
y:
git archive --format=zip --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | funzip
Estos escriben el archivo a la salida estándar.
En git, no 'desprotege' los archivos antes de actualizarlos ; parece que esto es lo que busca.
Muchos sistemas, como clearcase, csv, etc., requieren que "desproteja" un archivo antes de poder modificarlo. Git no requiere esto. Clonas un repositorio y luego haces cambios en tu copia local del repositorio.
Una vez que haya actualizado los archivos, puede hacer:
git status
Para ver qué archivos han sido modificados. Agregue los que desea comprometerse index
primero con ( index
es como una lista para registrarse):
git add .
o
git add blah.c
Luego, git status
le mostrará qué archivos se modificaron y cuáles están index
listos para ser confirmados o registrados.
Para enviar archivos a su copia del repositorio, haga lo siguiente:
git commit -a -m "commit message here"
Visite el git
sitio web para obtener enlaces a manuales y guías.
git format-patch
para crear un parche para su envío ( git format-patch -1
creará un parche solo para su confirmación más reciente).
Aquí está la solución completa para extraer y empujar solo un archivo en particular dentro del repositorio de git:
git clone --no-checkout <git url>
git reset
git checkout origin/master <path to file>
git add <path to file>
git commit -m <message text>
git push
También vea un enlace para obtener información adicional.
Parece que está tratando de transmitir una idea desde el control de versiones centralizado, que git por naturaleza no lo es, está distribuido. Si desea trabajar con un repositorio git, clónelo. Luego tiene todo el contenido del árbol de trabajo y todo el historial (bueno, al menos todo lo que lleva a la punta de la rama actual), no solo un solo archivo o una instantánea de una sola confirmación.
git clone /path/to/repo
git clone git://url/of/repo
git clone http://url/of/repo
Si necesita un archivo específico de una rama específica de un repositorio Git remoto, el comando es:
git archive --remote=git://git.example.com/project.git refs/heads/mybranch path/to/myfile |tar xf -
El resto puede derivarse de la respuesta de @ VonC:
Si necesita un archivo específico de la rama maestra es:
git archive --remote=git://git.example.com/project.git HEAD path/to/myfile |tar xf -
Si necesita un archivo específico de una etiqueta, es:
git archive --remote=git://git.example.com/project.git mytag path/to/myfile |tar xf -
No veo lo que funcionó para mí enumerado aquí, así que lo incluiré si alguien se encuentra en mi situación.
Mi situación, tengo un repositorio remoto de quizás 10,000 archivos y necesito construir un archivo RPM para mi sistema Linux. La construcción del RPM incluye un clon git de todo. Todo lo que necesito es un archivo para iniciar la compilación RPM. Puedo clonar todo el árbol fuente que hace lo que necesito, pero me toma dos minutos más descargar todos esos archivos cuando todo lo que necesito es uno. Traté de usar la opción de archivo git discutida y obtuve "fatal: Operación no compatible con el protocolo". Parece que tengo que habilitar algún tipo de opción de archivo en el servidor y mi servidor es mantenido por matones burocráticos que parecen disfrutar haciendo que sea difícil hacer las cosas.
Lo que finalmente hice fue entrar en la interfaz web para bitbucket y ver el único archivo que necesitaba. Hice un clic derecho en el enlace para descargar una copia sin procesar del archivo y seleccioné "copiar acceso directo" de la ventana emergente resultante. No podía simplemente descargar el archivo sin formato porque necesitaba automatizar las cosas y no tengo una interfaz de navegador en mi servidor Linux.
En aras de la discusión, eso resultó en la URL:
https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest
No pude descargar directamente este archivo desde el repositorio de bitbucket porque primero necesitaba iniciar sesión. Después de cavar un poco, descubrí que esto funcionaba: en Linux:
echo "myUser:myPass123"| base64
bXlVc2VyOm15UGFzczEyMwo=
curl -H 'Authorization: Basic bXlVc2VyOm15UGFzczEyMwo=' 'https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest' > bar.spec
Esta combinación me permitió descargar el único archivo que necesitaba para construir todo lo demás.
Estoy agregando esta respuesta como una alternativa a hacer un pago formal o alguna operación local similar. Suponiendo que tiene acceso a la interfaz web de su proveedor de Git, es posible que pueda ver directamente cualquier archivo en un commit deseado. Por ejemplo, en GitHub puede usar algo como:
https://github.com/hubotio/hubot/blob/ed25584f/src/adapter.coffee
Aquí ed25584f
están los primeros 8 caracteres del hash SHA-1 de la confirmación de interés, seguidos de la ruta al archivo fuente.
De manera similar, en Bitbucket podemos probar:
https://bitbucket.org/cofarrell/stash-browse-code-plugin/src/06befe08
En este caso, colocamos el hash de confirmación al final de la URL de origen.
Si solo necesita descargar el archivo, no necesita verificar con Git.
GitHub Mate es mucho más fácil de hacer, es una extensión de Chrome, le permite hacer clic en el icono del archivo para descargarlo. también de código abierto
git
! =github
Si ha editado una versión local de un archivo y desea volver a la versión original mantenida en el servidor central, esto se puede lograr fácilmente usando Extensiones Git .
¡Fácil!