我想检索 git 存储库中特定文件的所有以前版本。
我发现可以使用 checkout 命令获取一个特定版本,但我想要全部。并且带有深度选项的 git clone 命令似乎不允许我克隆子文件夹(“无效的存储库名称”)。
你知道这是否可能以及如何实现吗?
谢谢你
OP 想要检索所有版本,但无法提供答案。特别是如果文件有数百个修订(所有建议都过于手动)。唯一半工作的解决方案是由 @Tobias 在评论中提出的,但建议 bash 循环会以随机顺序构建文件,并且在针对我们的存储库使用时会生成数百个空文件。原因之一是“rev-list --all --objects”会列出不同的对象(包括树 - 但对我们的目的来说毫无用处)。
我从 Tobias 的解决方案开始,添加了计数器,进行了一些清理,最终以下面列出的 bash 脚本的形式重新发明了轮子。
脚本将:
cat /usr/local/bin/git_export_all_file_versions
#!/bin/bash
# we'll write all git versions of the file to this folder:
EXPORT_TO=/tmp/all_versions_exported
# take relative path to the file to inspect
GIT_PATH_TO_FILE=$1
# ---------------- don't edit below this line --------------
USAGE="Please cd to the root of your git proj and specify path to file you with to inspect (example: $0 some/path/to/file)"
# check if got argument
if [ "${GIT_PATH_TO_FILE}" == "" ]; then
echo "error: no arguments given. ${USAGE}" >&2
exit 1
fi
# check if file exist
if [ ! -f ${GIT_PATH_TO_FILE} ]; then
echo "error: File '${GIT_PATH_TO_FILE}' does not exist. ${USAGE}" >&2
exit 1
fi
# extract just a filename from given relative path (will be used in result file names)
GIT_SHORT_FILENAME=$(basename $GIT_PATH_TO_FILE)
# create folder to store all revisions of the file
if [ ! -d ${EXPORT_TO} ]; then
echo "creating folder: ${EXPORT_TO}"
mkdir ${EXPORT_TO}
fi
## uncomment next line to clear export folder each time you run script
#rm ${EXPORT_TO}/*
# reset coutner
COUNT=0
# iterate all revisions
git rev-list --all --objects -- ${GIT_PATH_TO_FILE} | \
cut -d ' ' -f1 | \
while read h; do \
COUNT=$((COUNT + 1)); \
COUNT_PRETTY=$(printf "%04d" $COUNT); \
COMMIT_DATE=`git show $h | head -3 | grep 'Date:' | awk '{print $4"-"$3"-"$6}'`; \
if [ "${COMMIT_DATE}" != "" ]; then \
git cat-file -p ${h}:${GIT_PATH_TO_FILE} > ${EXPORT_TO}/${COUNT_PRETTY}.${COMMIT_DATE}.${h}.${GIT_SHORT_FILENAME};\
fi;\
done
# return success code
echo "result stored to ${EXPORT_TO}"
exit 0
cd /home/myname/my-git-repo
git_export_all_file_versions docs/howto/readme.txt
result stored to /tmp/all_versions_exported
ls /tmp/all_versions_exported
0001.17-Oct-2016.ee0a1880ab815fd8f67bc4299780fc0b34f27b30.readme.txt
0002.3-Oct-2016.d305158b94bedabb758ff1bb5e1ad74ed7ccd2c3.readme.txt
0003.29-Sep-2016.7414a3de62529bfdd3cb1dd20ebc1a977793102f.readme.txt
0004.28-Sep-2016.604cc0a34ec689606f7d3b2b5bbced1eece7483d.readme.txt
0005.28-Sep-2016.198043c219c81d776c6d8a20e4f36bd6d8a57825.readme.txt
0006.9-Sep-2016.5aea5191d4b86aec416b031cb84c2b78603a8b0f.readme.txt
<and so on and on . . .>
注意#1:如果您看到这样的错误:
致命:不是有效的对象名称
3e93eba38b31b8b81905ceaa95eb47bbaed46494:自述文件.txt
这意味着您不是从 git 项目的根文件夹启动脚本。
注意#2:如果您想获取几次提交前删除的文件的所有版本,您将必须通过命令切换到该文件存在(尚未删除)的任何旧提交:
git checkout OLD_HASH_WHERE_FILE_EXISTED
git_export_all_file_versions path/to/existing/file.ext
否则会报错“文件不存在”。您不必切换到上次看到已删除文件的最后一次提交,而是可以是该文件所在的任何旧提交,然后“git_export_all_file_versions”将提取所有版本(甚至是相对于“未来”提交)您切换到的旧提交)。
Dmitry 提供的脚本确实解决了问题,但它有一些问题导致我对其进行调整以更适合我的需求。具体来说:
git show
的使用失败了。您可以在我的 github 存储库中看到我修改的最新版本或者这是撰写本文时的版本:
#!/bin/sh
# based on script provided by Dmitry Shevkoplyas at http://stackoverflow.com/questions/12850030/git-getting-all-previous-version-of-a-specific-file-folder
set -e
if ! git rev-parse --show-toplevel >/dev/null 2>&1 ; then
echo "Error: you must run this from within a git working directory" >&2
exit 1
fi
if [ "$#" -lt 1 ] || [ "$#" -gt 2 ]; then
echo "Usage: $0 <relative path to file> [<output directory>]" >&2
exit 2
fi
FILE_PATH="$1"
EXPORT_TO=/tmp/all_versions_exported
if [ -n "$2" ]; then
EXPORT_TO="$2"
fi
FILE_NAME="$(basename "$FILE_PATH")"
if [ ! -d "$EXPORT_TO" ]; then
echo "Creating directory '$EXPORT_TO'"
mkdir -p "$EXPORT_TO"
fi
echo "Writing files to '$EXPORT_TO'"
git log --diff-filter=d --date-order --reverse --format="%ad %H" --date=iso-strict "$FILE_PATH" | grep -v '^commit' | \
while read LINE; do \
COMMIT_DATE=`echo $LINE | cut -d ' ' -f 1`; \
COMMIT_SHA=`echo $LINE | cut -d ' ' -f 2`; \
printf '.' ; \
git cat-file -p "$COMMIT_SHA:$FILE_PATH" > "$EXPORT_TO/$COMMIT_DATE.$COMMIT_SHA.$FILE_NAME" ; \
done
echo
exit 0
输出示例:
$ git_export_all_file_versions bin/git_export_all_file_versions /tmp/stackoverflow/demo
Creating directory '/tmp/stackoverflow/demo'
Writing files to '/tmp/stackoverflow/demo'
...
$ ls -1 /tmp/stackoverflow/demo/
2017-05-02T15:52:52-04:00.c72640ed968885c3cc86812a2e1aabfbc2bc3b2a.git_export_all_file_versions
2017-05-02T16:58:56-04:00.bbbcff388d6f75572089964e3dc8d65a3bdf7817.git_export_all_file_versions
2017-05-02T17:05:50-04:00.67cbdeab97cd62813cec58d8e16d7c386c7dae86.git_export_all_file_versions
git rev-list --all --objects -- path/to/file.txt
列出与存储库路径关联的所有 blob
获取文件的特定版本
git cat-file -p commitid:path/to/file.txt
(commitid 可以是任何东西
git reflog
获得。我最近遇到了一种情况,我需要挖掘所有提交,甚至是那些由于交互式变基期间意外覆盖而不再属于日志的提交。我编写了这个 Ruby 脚本来输出文件的所有先前版本以查找孤立的提交。很容易 grep 其输出来追踪我丢失的文件。希望它对某人有帮助。
#!/usr/bin/env ruby
path_to_file = ""
`git reflog`.split("\n").each do |log|
puts commit = log.split(" ").first
puts `git show #{commit}:#{path_to_file}`
puts
end
同样的事情也可以用
git log
来完成。
#!/bin/sh
set -e
if ! git rev-parse --show-toplevel >/dev/null 2>&1 ; then
echo "Error: you must run this from within a git working directory" >&2
exit 1
fi
FILE_PATH=""
EXPORT_TO=""
FILE_NAME="$(basename "$FILE_PATH")"
if [ ! -d "$EXPORT_TO" ]; then
echo "Creating directory '$EXPORT_TO'"
mkdir -p "$EXPORT_TO"
fi
echo "Writing files to '$EXPORT_TO'"
# Get all commit hashes for the file
COMMITS=$(git log --pretty=format:%H -- $FILE_PATH)
# Loop over each commit
for COMMIT in $COMMITS
do
# Checkout the file at the commit
git checkout $COMMIT $FILE_PATH
# Copy the file to a new location with the commit hash in the name
cp $FILE_PATH "$EXPORT_TO/$FILE_NAME.$COMMIT.yaml"
done
# Reset the file to the latest commit
git checkout HEAD $FILE_PATH
尝试一下,使用起来更容易
git checkout -b branchname {commit#}
这可能足以进行快速而肮脏的手动更改比较:
对于脚本化解决方案,其他答案中已经提供了一些其他解决方案。