真人lora炼制 | 骆行沙ghostsf

20250210154057

分享一下经验：大概流程就是：数据集处理→参数调优→选择最佳模型。

数据集处理（重中之重）

数据集的质量直接影响到模型训练的效果，因此在数据集的选取上必须严格把控。
首先，图片质量是关键因素，优先选择写真原图，其分辨率高、细节丰富，能够为模型提供高质量的输入。如果无法获取写真原图，也应确保图片清晰度较高，单张图片大小最好在2MB以上，以满足训练对数据精度的要求。
其次，图片中人物的面部清晰度至关重要，无论是大头照还是全身图，面部都必须清晰无遮挡，不能被任何物体遮挡，以便模型能够准确地学习到面部特征。
此外，视角的覆盖范围也很重要，一个包含大头照、上半身照和全身照的数据集最为理想，这样能够使模型从不同角度学习人体特征，增强其泛化能力。
最后，图片风格的统一性也不容忽视，背景简单且带有景深的照片是最佳选择。如果背景较为复杂，则需要进行抠图处理，以避免背景对模型训练产生干扰。同时，应避免使用滤镜过重的图片，以免影响模型对真实特征的学习。

数据标注

数据标注是模型训练的基础环节，虽然在实际操作中可以适当简化流程，但也不能完全忽视其重要性。在标注过程中，应尽量确保标注的准确性和一致性，以便为模型提供清晰明确的训练目标。虽然在一些情况下可以通过自动化工具生成标注，但人工审核和修正仍然是必要的，以确保标注质量。

参数调优

参数调优是模型训练过程中的关键步骤，合理的参数设置能够显著提升模型的性能。以训练512×768分辨率的上半身图片为例，与网络相关的两个参数均设置为128，每张图片训练7步，总共训练25张图片。在学习率的调整方面，首先可以使用DAD优化器来寻找最佳的学习率。通过实验和观察，找到一个合适的学习率范围，然后根据经验公式lr=unet lr=8×text lr进行调整，以平衡不同模块的学习速度，确保模型能够稳定且高效地进行训练。

损失曲线分析

损失曲线是评估模型训练效果的重要指标之一，但并非损失值越低就越好。关键在于观察损失曲线是否呈现稳步下降的趋势，只要损失曲线能够持续下降，就说明模型在不断进步，正在逐步学习到数据中的特征和规律。在选择最佳模型时，不能仅仅依赖损失曲线，还需要结合其他评估指标。例如，可以使用XY图（即输入图片与生成图片的对比图）来进行直观的比较。通过观察XY图，可以直观地评估模型生成的图片与目标图片之间的相似度，从而更准确地判断模型的性能。

最佳模型选择

在模型选择阶段，需要综合考虑多个因素。首先，选取上半身图片作为测试样本，从中挑选出几个面部特征较为明显的图片进行XY图绘制，以评估模型对关键部位的生成效果。此外，还需要选择一些泛化性较强的样本，绘制全身照的XY图，以评估模型在不同场景下的表现。通过对比这些XY图，可以全面地评估模型的性能，最终选择出生成效果最佳、泛化能力最强的模型作为最终模型。

总之，数据集处理、参数调优和模型选择是深度学习模型训练过程中的关键环节，每个环节都至关重要，不容忽视。只有通过严谨的流程和科学的方法，才能训练出性能优异、泛化能力强的模型，为实际应用提供可靠的支持。