Update README.md
Browse files
README.md
CHANGED
|
@@ -0,0 +1,11 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# 修正版 DeepSeek-R1 671B 模型文件 (适用于微调)
|
| 2 |
+
|
| 3 |
+
## 项目简介
|
| 4 |
+
|
| 5 |
+
本项目提供了一个针对 DeepSeek-R1 671B 大语言模型的 `modeling_deepseek.py` 文件的修正版本。
|
| 6 |
+
|
| 7 |
+
官方 Hugging Face Transformers 库中提供的原始 `modeling_deepseek.py` 文件在进行**模型微调 (Fine-tuning)** 时,可能存在一些已知或未知的问题。
|
| 8 |
+
|
| 9 |
+
这个修改后的版本旨在解决这些在微调过程中可能遇到的障碍,使得研究人员和开发者能够更顺畅、更稳定地对 DeepSeek-R1 671B 模型进行微调。
|
| 10 |
+
|
| 11 |
+
|