Skip to content

Git 版本控制基础

管理代码,保护成果


为什么需要 Git?

  • 追踪代码变化
  • 回退到之前版本
  • 多人协作
  • 备份代码

基本操作

初始化仓库

bash
# 初始化
git init

# 配置用户信息
git config --global user.name "Your Name"
git config --global user.email "your.email@example.com"

基本工作流

bash
# 1. 查看状态
git status

# 2. 添加文件
git add analysis.py
git add .  # 添加所有文件

# 3. 提交
git commit -m "添加数据分析脚本"

# 4. 查看历史
git log
git log --oneline

常用命令

bash
# 查看差异
git diff

# 回退更改
git checkout -- file.py  # 丢弃未暂存的更改
git reset HEAD file.py   # 取消暂存

# 查看历史版本
git log --oneline
git show <commit-id>

# 回退到某个版本
git reset --hard <commit-id>

GitHub 协作

bash
# 克隆仓库
git clone https://github.com/username/repo.git

# 推送到远程
git push origin main

# 拉取更新
git pull origin main

最佳实践

1. .gitignore

# .gitignore 文件
*.pyc
__pycache__/
.ipynb_checkpoints/
data/
.env
*.log

2. 提交信息规范

bash
#  好的提交信息
git commit -m "添加收入数据清洗函数"
git commit -m "修复年龄筛选的bug"

#  不好的提交信息
git commit -m "update"
git commit -m "fix"

3. 常用工作流

bash
# 日常流程
git status          # 检查状态
git add .           # 添加所有更改
git commit -m "描述更改"  # 提交
git push            # 推送到远程(如果有)

社科研究项目示例

research_project/
├── .git/
├── .gitignore
├── README.md
├── data/              # 不上传(.gitignore)
│   ├── raw/
│   └── processed/
├── code/
│   ├── 01_data_cleaning.py
│   ├── 02_analysis.py
│   └── 03_visualization.py
├── notebooks/
│   └── exploratory_analysis.ipynb
├── outputs/
│   ├── figures/
│   └── tables/
└── requirements.txt

恭喜完成全部 40 篇!

你已掌握

  • Python 基础语法
  • 数据结构与函数
  • 文件操作与异常处理
  • Pandas 数据分析
  • 数据可视化
  • 机器学习与 LLM API
  • 最佳实践

下一步

  1. 实践项目(分析真实数据)
  2. 阅读他人代码(GitHub)
  3. 参与开源项目
  4. 持续学习

开始你的 Python 数据分析之旅吧!


推荐资源

祝你学习愉快!

基于 MIT 许可证发布。内容版权归作者所有。