git - 获取特定文件/文件夹的所有先前版本

问题描述 投票:0回答:7

我想检索 git 存储库中特定文件的所有以前版本。

我发现可以使用 checkout 命令获取一个特定版本,但我想要全部。并且带有深度选项的 git clone 命令似乎不允许我克隆子文件夹(“无效的存储库名称”)。

你知道这是否可能以及如何实现吗?

谢谢你

git git-clone git-checkout
7个回答
48
投票

OP 想要检索所有版本,但无法提供答案。特别是如果文件有数百个修订(所有建议都过于手动)。唯一半工作的解决方案是由 @Tobias 在评论中提出的,但建议 bash 循环会以随机顺序构建文件,并且在针对我们的存储库使用时会生成数百个空文件。原因之一是“rev-list --all --objects”会列出不同的对象(包括树 - 但对我们的目的来说毫无用处)。

我从 Tobias 的解决方案开始,添加了计数器,进行了一些清理,最终以下面列出的 bash 脚本的形式重新发明了轮子。

脚本将:

  • all 文件版本提取到 /tmp/all_versions_exported
  • 采用 1 个参数 - git repo 中文件的相对路径
  • 给出结果文件名数字前缀(可排序)
  • 在结果文件中提及检查的文件名(以区分苹果和橙子:)
  • 在结果文件名中提及提交日期(请参阅下面的输出示例)
  • 不创建空结果文件

cat /usr/local/bin/git_export_all_file_versions

#!/bin/bash

# we'll write all git versions of the file to this folder:
EXPORT_TO=/tmp/all_versions_exported

# take relative path to the file to inspect
GIT_PATH_TO_FILE=$1

# ---------------- don't edit below this line --------------

USAGE="Please cd to the root of your git proj and specify path to file you with to inspect (example: $0 some/path/to/file)"

# check if got argument
if [ "${GIT_PATH_TO_FILE}" == "" ]; then
    echo "error: no arguments given. ${USAGE}" >&2
    exit 1
fi

# check if file exist
if [ ! -f ${GIT_PATH_TO_FILE} ]; then
    echo "error: File '${GIT_PATH_TO_FILE}' does not exist. ${USAGE}" >&2
    exit 1
fi

# extract just a filename from given relative path (will be used in result file names)
GIT_SHORT_FILENAME=$(basename $GIT_PATH_TO_FILE)

# create folder to store all revisions of the file
if [ ! -d ${EXPORT_TO} ]; then
    echo "creating folder: ${EXPORT_TO}"
    mkdir ${EXPORT_TO}
fi

## uncomment next line to clear export folder each time you run script
#rm ${EXPORT_TO}/*

# reset coutner
COUNT=0

# iterate all revisions
git rev-list --all --objects -- ${GIT_PATH_TO_FILE} | \
    cut -d ' ' -f1 | \
while read h; do \
     COUNT=$((COUNT + 1)); \
     COUNT_PRETTY=$(printf "%04d" $COUNT); \
     COMMIT_DATE=`git show $h | head -3 | grep 'Date:' | awk '{print $4"-"$3"-"$6}'`; \
     if [ "${COMMIT_DATE}" != "" ]; then \
         git cat-file -p ${h}:${GIT_PATH_TO_FILE} > ${EXPORT_TO}/${COUNT_PRETTY}.${COMMIT_DATE}.${h}.${GIT_SHORT_FILENAME};\
     fi;\
done    

# return success code
echo "result stored to ${EXPORT_TO}"
exit 0

使用示例:
cd /home/myname/my-git-repo

git_export_all_file_versions docs/howto/readme.txt
    result stored to /tmp/all_versions_exported

ls /tmp/all_versions_exported
    0001.17-Oct-2016.ee0a1880ab815fd8f67bc4299780fc0b34f27b30.readme.txt
    0002.3-Oct-2016.d305158b94bedabb758ff1bb5e1ad74ed7ccd2c3.readme.txt
    0003.29-Sep-2016.7414a3de62529bfdd3cb1dd20ebc1a977793102f.readme.txt
    0004.28-Sep-2016.604cc0a34ec689606f7d3b2b5bbced1eece7483d.readme.txt
    0005.28-Sep-2016.198043c219c81d776c6d8a20e4f36bd6d8a57825.readme.txt
    0006.9-Sep-2016.5aea5191d4b86aec416b031cb84c2b78603a8b0f.readme.txt
    <and so on and on . . .>

注意#1:如果您看到这样的错误:

致命:不是有效的对象名称
3e93eba38b31b8b81905ceaa95eb47bbaed46494:自述文件.txt

这意味着您不是从 git 项目的根文件夹启动脚本。

注意#2:如果您想获取几次提交前删除的文件的所有版本,您将必须通过命令切换到该文件存在(尚未删除)的任何旧提交:

git checkout OLD_HASH_WHERE_FILE_EXISTED
git_export_all_file_versions path/to/existing/file.ext

否则会报错“文件不存在”。您不必切换到上次看到已删除文件的最后一次提交,而是可以是该文件所在的任何旧提交,然后“git_export_all_file_versions”将提取所有版本(甚至是相对于“未来”提交)您切换到的旧提交)。


37
投票

Dmitry 提供的脚本确实解决了问题,但它有一些问题导致我对其进行调整以更适合我的需求。具体来说:

  1. 由于我的默认日期格式设置,
    git show
    的使用失败了。
  2. 我希望结果按日期顺序排序,而不是逆日期顺序。
  3. 我希望能够针对已从存储库中删除的文件运行它。
  4. 我不想对所有分支进行所有修改;我只是想从 HEAD 获得修订。
  5. 如果它不在 git 存储库中,我希望它出错。
  6. 我不想编辑脚本来调整某些选项。
  7. 它的工作方式效率低下。
  8. 我不需要输出文件名中的编号。 (格式适当的日期具有相同的目的。)
  9. 我想要更安全的“带空格的路径”处理

您可以在我的 github 存储库中看到我修改的最新版本或者这是撰写本文时的版本:

#!/bin/sh # based on script provided by Dmitry Shevkoplyas at http://stackoverflow.com/questions/12850030/git-getting-all-previous-version-of-a-specific-file-folder set -e if ! git rev-parse --show-toplevel >/dev/null 2>&1 ; then echo "Error: you must run this from within a git working directory" >&2 exit 1 fi if [ "$#" -lt 1 ] || [ "$#" -gt 2 ]; then echo "Usage: $0 <relative path to file> [<output directory>]" >&2 exit 2 fi FILE_PATH="$1" EXPORT_TO=/tmp/all_versions_exported if [ -n "$2" ]; then EXPORT_TO="$2" fi FILE_NAME="$(basename "$FILE_PATH")" if [ ! -d "$EXPORT_TO" ]; then echo "Creating directory '$EXPORT_TO'" mkdir -p "$EXPORT_TO" fi echo "Writing files to '$EXPORT_TO'" git log --diff-filter=d --date-order --reverse --format="%ad %H" --date=iso-strict "$FILE_PATH" | grep -v '^commit' | \ while read LINE; do \ COMMIT_DATE=`echo $LINE | cut -d ' ' -f 1`; \ COMMIT_SHA=`echo $LINE | cut -d ' ' -f 2`; \ printf '.' ; \ git cat-file -p "$COMMIT_SHA:$FILE_PATH" > "$EXPORT_TO/$COMMIT_DATE.$COMMIT_SHA.$FILE_NAME" ; \ done echo exit 0
输出示例:

$ git_export_all_file_versions bin/git_export_all_file_versions /tmp/stackoverflow/demo Creating directory '/tmp/stackoverflow/demo' Writing files to '/tmp/stackoverflow/demo' ... $ ls -1 /tmp/stackoverflow/demo/ 2017-05-02T15:52:52-04:00.c72640ed968885c3cc86812a2e1aabfbc2bc3b2a.git_export_all_file_versions 2017-05-02T16:58:56-04:00.bbbcff388d6f75572089964e3dc8d65a3bdf7817.git_export_all_file_versions 2017-05-02T17:05:50-04:00.67cbdeab97cd62813cec58d8e16d7c386c7dae86.git_export_all_file_versions
    

9
投票
git rev-list --all --objects -- path/to/file.txt

列出与存储库路径关联的所有 blob

获取文件的特定版本

git cat-file -p commitid:path/to/file.txt

(commitid 可以是任何东西

    符号引用(分支、标签名称;远程)
  • 提交哈希
  • 修订规范,如 HEAD~3、branch1@{4} 等。

0
投票
有时文件的旧版本只能通过

git reflog

 获得。我最近遇到了一种情况,我需要挖掘所有提交,甚至是那些由于交互式变基期间意外覆盖而不再属于日志的提交。

我编写了这个 Ruby 脚本来输出文件的所有先前版本以查找孤立的提交。很容易 grep 其输出来追踪我丢失的文件。希望它对某人有帮助。

#!/usr/bin/env ruby path_to_file = "" `git reflog`.split("\n").each do |log| puts commit = log.split(" ").first puts `git show #{commit}:#{path_to_file}` puts end

同样的事情也可以用

git log

 来完成。


0
投票
您可以使用

git blame <file>

也在这里:

https://docs.github.com/en/github/managing-files-in-a-repository/managing-files-on-github/tracking-changes-in-a-file


0
投票
#!/bin/sh set -e if ! git rev-parse --show-toplevel >/dev/null 2>&1 ; then echo "Error: you must run this from within a git working directory" >&2 exit 1 fi FILE_PATH="" EXPORT_TO="" FILE_NAME="$(basename "$FILE_PATH")" if [ ! -d "$EXPORT_TO" ]; then echo "Creating directory '$EXPORT_TO'" mkdir -p "$EXPORT_TO" fi echo "Writing files to '$EXPORT_TO'" # Get all commit hashes for the file COMMITS=$(git log --pretty=format:%H -- $FILE_PATH) # Loop over each commit for COMMIT in $COMMITS do # Checkout the file at the commit git checkout $COMMIT $FILE_PATH # Copy the file to a new location with the commit hash in the name cp $FILE_PATH "$EXPORT_TO/$FILE_NAME.$COMMIT.yaml" done # Reset the file to the latest commit git checkout HEAD $FILE_PATH
尝试一下,使用起来更容易


-2
投票
当您 git 克隆文件时,文件的所有版本都已在 git 存储库中。您可以创建与特定提交的签出相关的分支:

git checkout -b branchname {commit#}

这可能足以进行快速而肮脏的手动更改比较:

    到分行结帐
  • 复制到编辑器缓冲区
如果您只需要关心几个版本并且不介意一些手动操作(尽管是 git 内置命令),那么这可能没问题。

对于脚本化解决方案,其他答案中已经提供了一些其他解决方案。

© www.soinside.com 2019 - 2024. All rights reserved.