AI微调

微调就像给一个“学霸”补课，让它从“通才”变成某个领域的“专家”。此处以本文进行微调的医学数据进行举例：

假设你有一个很聪明的朋友，他读过全世界的书（相当于大模型的预训练阶段），能和你聊历史、科学、文学等各种话题。但如果你需要他帮你看医学报告段），能和你聊历史、科学、文学等各种话题。但如果你需要他帮你看医学报告，虽然他懂一些基础知识，但可能不够专业。这时候，你给他一堆医学书籍和病例，让他专门学习

微调前：

输入提示：
诊断问题：头痛、恶心、呕吐
详细分析：换着头痛持续3天，伴有恶心和呕吐，无发热

生成的文本：
诊断问题：头痛、恶心呕吐
详细分析：换着头痛持续3天，伴有恶心和呕吐，无发热，诊断为急性胃炎。但患者最新出现心痛和胸痛，加重，伴有心悸、呼吸困难。

根据您的描述，头痛、恶心、呕吐、心痛、胸痛加重，呼吸困难、加重、意识障碍加重是严重的急性胃炎的表现，需要进一步诊断。急性胃炎通常急需通过胃镜等影像学检查来明确。因此，您的症状符合急性感染性胃炎的特征，需要进行胃镜或超声波胃镜检查来明确诊断。

微调后：

首先，我想到可能是胃炎，因为胃炎会导致胃部不适，包括头痛、恶心和呕吐。但我要考虑是否有其他可能性，比如胃溃疡，因为胃溃疡也会导致胃部不适。虽然胃溃疡通常与胃部溃疡有关....

在此处可以看到很明显大模型进行微调后口吻已经发生了更改。而且微调后的大模型思考时间更加短暂。

一、什么是大模型微调？

微调就像给一个“学霸”补课，让它从“通才”变成某个领域的“专家”。

此处以本文进行微调的医学数据进行举例：

假设你有一个很聪明的朋友，他读过全世界的书（相当于大模型的预训练阶段），能和你聊历史、科学、文学等各种话题。但如果你需要他帮你看医学报告段），能和你聊历史、科学、文学等各种话题。但如果你需要他帮你看医学报告，虽然他懂一些基础知识，但可能不够专业。这时候，你给他一堆医学书籍和病例，让他专门学习这方面的知识（这就是微调），他就会变得更擅长医疗领域的问题。

故事解释：

想象你有一个会画小猫的机器人（这就是预训练模型）。现在你想让它学会画戴帽子的小猫。不需要从头教它画画，只需要给它看很多”戴帽子小猫”的图片，然后说：“保持原来的画画能力，但要学会加帽子哦！” 这就是微调！

生活案例解释：

案例1：智能音箱调方言

基础版音箱只会普通话（预训练模型）
给它听 100 句四川话（微调数据）
现在能听懂”摆龙门阵”（方言理解能力↑）

案例2：相机滤镜原理

原始相机拍所有场景（通用模型）
加载“美食滤镜”参数（微调后的模型）
拍食物时自动增强饱和度（专业能力强化）

二、硬件配置

显卡：NVIDIA GeForce RTX 4060
CPU：Intel Core i7-13700H
内存：16 G(因为家庭电脑所以日常状态是 8.8/15.7 GB)

三、微调工作

(1) 数据集准备
本文数据集来源，魔搭社区的 medical-o1-reasoning-SFT。

{
    "Question": "根据描述，一个1岁的孩子在夏天头皮出现多出小结节，长期不愈合，且现在疮大如梅，溃破流脓，口不收敛，头皮下有空洞..."
    "Complex_CoT": "这个小孩在夏天头皮上长了些小结节，一直都没好，后来变成了脓包，想想夏天那么热，可能和湿热有关..."
    "Response": "从中医的角度来看，你所描述的症状符合"蝼蛄只"的病症。这种病症通常发生在头皮，表现为多出结节，溃破流脓，形成空洞..."
}

在 DeepSeek 的蒸馏模型微调过程中，数据集中引入 Complex_CoT（复杂思维链）是关键设计差异。若仅使用基础问答对进行训练，模型将难以充分习得深度推理能力，导致最终性能显著低于预期水平。这一特性与常规大模型微调的数据要求存在本质区别。