读过前一节有关 git svn 的内容以后,你应该能轻而易举的根据其中的指导来 git svn clone 一个仓库了;然后,停止 Subversion 的使用,向一个新 Git server 推送,并开始使用它。想保留历史记录,所花的时间应该不过就是从 Subversion 服务器拉取数据的时间(可能要等上好一会就是了)。
然而,这样的导入并不完美;而且还要花那么多时间,不如干脆一次把它做对!首当其冲的任务是作者信息。在 Subversion,每个提交者在都在主机上有一个用户名,记录在提交信息中。上节例子中多处显示了schacon ,比如 blame 的输出以及 git svn log。如果想让这条信息更好的映射到 Git 作者数据里,则需要 从 Subversion 用户名到 Git 作者的一个映射关系。建立一个叫做 user.txt 的文件,用如下格式表示映射关系:
schacon = Scott Chacon <[email protected]>
selse = Someo Nelse <[email protected]>
通过该命令可以获得 SVN 作者的列表:
$ svn log ^/ --xml | grep -P "^<author" | sort -u | \
perl -pe 's/<author>(.*?)<\/author>/$1 = /' > users.txt
它将输出 XML 格式的日志——你可以找到作者,建立一个单独的列表,然后从 XML 中抽取出需要的信息。(显而易见,本方法要求主机上安装了grep,sort 和 perl.)然后把输出重定向到 user.txt 文件,然后就可以在每一项的后面添加相应的 Git 用户数据。
为 git svn 提供该文件可以然它更精确的映射作者数据。你还可以在 clone 或者 init后面添加 --no-metadata 来阻止 git svn 包含那些 Subversion 的附加信息。这样 import 命令就变成了:
$ git svn clone http://my-project.googlecode.com/svn/ \
--authors-file=users.txt --no-metadata -s my_project
现在 my_project 目录下导入的 Subversion 应该比原来整洁多了。原来的 commit 看上去是这样:
[code]commit 37efa680e8473b615de980fa935944215428a35a
Author: schacon schacon@4c93b258-373f-11de-be05-5f7a86268029
Date: Sun May 3 00:12:22 2009 +0000
fixed install - go to trunk
git-svn-id: https://my-project.googlecode.com/svn/trunk@94 4c93b258-373f-11de-
be05-5f7a86268029[/code]
现在是这样:
[code]commit 03a8785f44c8ea5cdb0e8834b7c8e6c469be2ff2
Author: Scott Chacon [email protected]
Date: Sun May 3 00:12:22 2009 +0000
fixed install - go to trunk[/code]
不仅作者一项干净了不少,git-svn-id 也就此消失了。
你还需要一点 post-import(导入后) 清理工作。
最起码的,应该清理一下 git svn 创建的那些怪异的索引结构。首先要移动标签,把它们从奇怪的远程分支变成实际的标签,然后把剩下的分支移动到本地。
要把标签变成合适的 Git 标签,运行
$ git for-each-ref refs/remotes/tags | cut -d / -f 4- | grep -v [url=home.php?mod=space&uid=32730]@[/url] | while read tagname; do git tag "$tagname" "tags/$tagname"; git branch -r -d "tags/$tagname"; done
该命令将原本以 tag/ 开头的远程分支的索引变成真正的(轻巧的)标签。
接下来,把 refs/remotes 下面剩下的索引变成本地分支:
$ git for-each-ref refs/remotes | cut -d / -f 3- | grep -v [url=home.php?mod=space&uid=32987]@[/url] | while read branchname; do git branch "$branchname" "refs/remotes/$branchname"; git branch -r -d "$branchname"; done
现在所有的旧分支都变成真正的 Git 分支,所有的旧标签也变成真正的 Git 标签。最后一项工作就是把新建的 Git 服务器添加为远程服务器并且向它推送。下面是新增远程服务器的例子:
$ git remote add origin git@my-git-server:myrepository.git
为了让所有的分支和标签都得到上传,我们使用这条命令:
$ git push origin --all
$ git push origin --tags
所有的分支和标签现在都应该整齐干净的躺在新的 Git 服务器里了。
REF:http://cwiki.ossez.com/pages/viewpage.action?pageId=7045946