标签不完整数据集的训练

2024-06-16 11:18:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个问题,我有大约10万个标记图像的语义分割。它们被贴上了8个不同的类标签。你知道吗

对于其中的4k,我有一个不同的(但非常相似的问题)额外的标签。我能够将这些标签转换为适合原始问题的标签,从而将8个类扩展到9个类。现在我希望在这9个类上进行训练,而不要浪费掉那些缺少这些额外类标签的6k类。你知道吗

计划是这样的

  1. 6k列8个班
  2. 初始化9个类的新网络,权重从(1)加载
  3. 冻结所有,但得分层和4k集再培训
  4. 列车4k再次设置,但从(3)加载重量

我已经做到了这一点,并尝试了多个步骤(4)。我已经逐步冻结阶段(Resnet50),并试图降低学习率。没有一个达到类似的业绩。由于增加了复杂性,我预计会有小幅下降,但问题非常类似,一个类被拆分为两个。我预计这两个类之间会有一些混淆,但所有其他类都没有表现好。你知道吗

如果不是所有的数据集都包含这个额外的标签,那么将问题扩展到添加额外的类标签的正确方法是什么。你知道吗


Tags: 标记图像网络分层语义浪费步骤标签