Git 版本控制基础
管理代码,保护成果
为什么需要 Git?
- 追踪代码变化
- 回退到之前版本
- 多人协作
- 备份代码
基本操作
初始化仓库
bash
# 初始化
git init
# 配置用户信息
git config --global user.name "Your Name"
git config --global user.email "your.email@example.com"基本工作流
bash
# 1. 查看状态
git status
# 2. 添加文件
git add analysis.py
git add . # 添加所有文件
# 3. 提交
git commit -m "添加数据分析脚本"
# 4. 查看历史
git log
git log --oneline常用命令
bash
# 查看差异
git diff
# 回退更改
git checkout -- file.py # 丢弃未暂存的更改
git reset HEAD file.py # 取消暂存
# 查看历史版本
git log --oneline
git show <commit-id>
# 回退到某个版本
git reset --hard <commit-id>GitHub 协作
bash
# 克隆仓库
git clone https://github.com/username/repo.git
# 推送到远程
git push origin main
# 拉取更新
git pull origin main最佳实践
1. .gitignore
# .gitignore 文件
*.pyc
__pycache__/
.ipynb_checkpoints/
data/
.env
*.log2. 提交信息规范
bash
# 好的提交信息
git commit -m "添加收入数据清洗函数"
git commit -m "修复年龄筛选的bug"
# 不好的提交信息
git commit -m "update"
git commit -m "fix"3. 常用工作流
bash
# 日常流程
git status # 检查状态
git add . # 添加所有更改
git commit -m "描述更改" # 提交
git push # 推送到远程(如果有)社科研究项目示例
research_project/
├── .git/
├── .gitignore
├── README.md
├── data/ # 不上传(.gitignore)
│ ├── raw/
│ └── processed/
├── code/
│ ├── 01_data_cleaning.py
│ ├── 02_analysis.py
│ └── 03_visualization.py
├── notebooks/
│ └── exploratory_analysis.ipynb
├── outputs/
│ ├── figures/
│ └── tables/
└── requirements.txt恭喜完成全部 40 篇!
你已掌握:
- Python 基础语法
- 数据结构与函数
- 文件操作与异常处理
- Pandas 数据分析
- 数据可视化
- 机器学习与 LLM API
- 最佳实践
下一步:
- 实践项目(分析真实数据)
- 阅读他人代码(GitHub)
- 参与开源项目
- 持续学习
开始你的 Python 数据分析之旅吧!
推荐资源
祝你学习愉快!