微调就像给一个“学霸”补课,让它从“通才”变成某个领域的“专家”。此处以本文进行微调的医学数据进行举例:
假设你有一个很聪明的朋友,他读过全世界的书(相当于大模型的预训练阶段),能和你聊历史、科学、文学等各种话题。但如果你需要他帮你看医学报告段),能和你聊历史、科学、文学等各种话题。但如果你需要他帮你看医学报告,虽然他懂一些基础知识,但可能不够专业。这时候,你给他一堆医学书籍和病例,让他专门学习
微调前:
输入提示:
诊断问题:头痛、恶心、呕吐
详细分析:换着头痛持续3天,伴有恶心和呕吐,无发热
生成的文本:
诊断问题:头痛、恶心呕吐
详细分析:换着头痛持续3天,伴有恶心和呕吐,无发热,诊断为急性胃炎。但患者最新出现心痛和胸痛,加重,伴有心悸、呼吸困难。
根据您的描述,头痛、恶心、呕吐、心痛、胸痛加重,呼吸困难、加重、意识障碍加重是严重的急性胃炎的表现,需要进一步诊断。急性胃炎通常急需通过胃镜等影像学检查来明确。因此,您的症状符合急性感染性胃炎的特征,需要进行胃镜或超声波胃镜检查来明确诊断。
微调后:
首先,我想到可能是胃炎,因为胃炎会导致胃部不适,包括头痛、恶心和呕吐。但我要考虑是否有其他可能性,比如胃溃疡,因为胃溃疡也会导致胃部不适。虽然胃溃疡通常与胃部溃疡有关....
在此处可以看到很明显大模型进行微调后口吻已经发生了更改。而且微调后的大模型思考时间更加短暂。
一、什么是大模型微调?
微调就像给一个“学霸”补课,让它从“通才”变成某个领域的“专家”。
此处以本文进行微调的医学数据进行举例:
假设你有一个很聪明的朋友,他读过全世界的书(相当于大模型的预训练阶段),能和你聊历史、科学、文学等各种话题。 但如果你需要他帮你看医学报告段),能和你聊历史、科学、文学等各种话题。 但如果你需要他帮你看医学报告,虽然他懂一些基础知识,但可能不够专业。这时候,你给他一堆医学书籍和病例,让他专门学习这方面的知识(这就是微调),他就会变得更擅长医疗领域的问题。
故事解释:
想象你有一个会画小猫的机器人(这就是预训练模型)。现在你想让它学会画戴帽子的小猫。不需要从头教它画画,只需要给它看很多”戴帽子小猫”的图片,然后说:“保持原来的画画能力,但要学会加帽子哦!” 这就是微调!
生活案例解释:
案例1:智能音箱调方言
基础版音箱只会普通话(预训练模型)
给它听 100 句四川话(微调数据)
现在能听懂”摆龙门阵”(方言理解能力↑)
案例2:相机滤镜原理
原始相机拍所有场景(通用模型)
加载“美食滤镜”参数(微调后的模型)
拍食物时自动增强饱和度(专业能力强化)
二、硬件配置
显卡:NVIDIA GeForce RTX 4060
CPU:Intel Core i7-13700H
内存:16 G(因为家庭电脑所以日常状态是 8.8/15.7 GB)
三、微调工作
(1) 数据集准备
本文数据集来源,魔搭社区的 medical-o1-reasoning-SFT。
{
"Question": "根据描述,一个1岁的孩子在夏天头皮出现多出小结节,长期不愈合,且现在疮大如梅,溃破流脓,口不收敛,头皮下有空洞..."
"Complex_CoT": "这个小孩在夏天头皮上长了些小结节,一直都没好,后来变成了脓包,想想夏天那么热,可能和湿热有关..."
"Response": "从中医的角度来看,你所描述的症状符合"蝼蛄只"的病症。这种病症通常发生在头皮,表现为多出结节,溃破流脓,形成空洞..."
}
在 DeepSeek 的蒸馏模型微调过程中,数据集中引入 Complex_CoT(复杂思维链)是关键设计差异。若仅使用基础问答对进行训练,模型将难以充分习得深度推理能力,导致最终性能显著低于预期水平。这一特性与常规大模型微调的数据要求存在本质区别。