其他

ATSS：正负样本的选择如何决定检测性能

悠悠楠杉

2025-12-07

0 评论

77 阅读

正在检测是否收录...

12/07

正文：

在目标检测领域，一个长期困扰研究者的核心问题是：如何为每个目标选择合适的正负样本进行训练？这个看似简单的选择，实际上直接决定了检测模型的性能上限。传统的IoU阈值方法虽然简单直接，但其固定阈值的设定往往无法适应复杂多变的实际场景。直到2020年，ATSS（Adaptive Training Sample Selection）算法的提出，才为这个难题提供了全新的解决方案。

传统方法的局限性

在ATSS出现之前，目标检测器主要依赖固定的IoU阈值来划分正负样本。以Faster R-CNN为代表的单阶段检测器通常设置一个正样本阈值（如0.5）和一个负样本阈值（如0.4）。当Anchor与真实框的IoU高于0.5时被标记为正样本，低于0.4时被标记为负样本，介于两者之间的样本则被忽略。

这种方法存在明显缺陷：固定阈值无法适应不同目标的特性。对于大型目标，合适的阈值可能较高；而对于小型目标，相同的阈值可能过于严格，导致正样本数量不足。这种“一刀切”的策略使得模型在不同尺度目标上的表现差异显著。

ATSS的核心突破

ATSS算法的创新在于彻底抛弃了固定的IoU阈值，转而根据每个目标的统计特性自适应地确定正负样本。其核心流程包含三个关键步骤：

首先，对于每个真实框，选择特征金字塔每层中IoU最高的k个候选Anchor（默认k=9）。这样确保了在每个特征层级都能为目标找到最匹配的候选样本。

其次，计算这些候选Anchor与真实框IoU的均值μ和标准差σ。这两个统计量捕捉了当前目标在特征金字塔中的匹配分布特性。

最后，将μ+σ作为该目标的正样本阈值，IoU高于此阈值的候选Anchor被确定为最终的正样本。同时，ATSS还限制了正样本必须位于真实框中心一定范围内，并确保每个Anchor最多匹配一个真实框。

这种自适应机制的精妙之处在于：对于匹配质量较高的目标（IoU分布集中），阈值会自动提高，筛选出更高质量的正样本；而对于匹配困难的目标（IoU分布分散），阈值会相应降低，确保获得足够的正样本进行训练。

与Anchor-free的天然联系

ATSS的另一个重要洞察是揭示了Anchor-based和Anchor-free方法的内在统一性。研究者发现，当设置k=1且Anchor覆盖每个位置时，ATSS退化为Anchor-free的样本选择策略。这一发现打破了传统上对两种方法的严格区分，表明它们本质上只是样本选择策略的不同实现。

这种统一视角解释了为何近年来Anchor-free方法能够取得与Anchor-based方法相媲美的性能——它们实际上都在解决同一个核心问题：如何为每个目标选择适当的训练样本。

实践中的显著效果

在实际应用中，ATSS带来的性能提升令人印象深刻。在不增加任何计算成本的情况下，仅通过改进样本选择策略，ATSS就将RetinaNet在COCO数据集上的AP从37.0提升到39.3，将FCOS从38.7提升到40.3。这种“免费午餐”式的改进充分证明了样本选择策略的重要性。

以下是ATSS核心算法的简化实现：


import torch

def atss_selection(anchors, gt_boxes, k=9):
    """
    ATSS正样本选择算法简化实现
    anchors: 所有Anchor框 [N,4]
    gt_boxes: 真实目标框 [M,4]  
    k: 每层选择的候选数量
    """
    # 计算IoU矩阵 [M, N]
    ious = calculate_iou(gt_boxes, anchors)
    
    positive_mask = torch.zeros_like(ious, dtype=torch.bool)
    
    for i, gt_box in enumerate(gt_boxes):
        # 步骤1：每层选择top-k候选
        candidate_indices = select_topk_candidates(ious[i], k)
        
        # 步骤2：计算均值和标准差
        candidate_ious = ious[i][candidate_indices]
        mean_iou = candidate_ious.mean()
        std_iou = candidate_ious.std()
        
        # 步骤3：自适应阈值
        threshold = mean_iou + std_iou
        
        # 确定最终正样本
        final_positives = candidate_indices[candidate_ious >= threshold]
        positive_mask[i][final_positives] = True
    
    return positive_mask

样本选择的深远影响

ATSS的成功揭示了目标检测中一个被长期忽视的真相：样本选择的质量比网络结构的设计更为关键。无论多么复杂的检测头，如果喂入的是质量低劣的训练样本，最终性能必然受限。

这种思想正在推动目标检测研究范式的转变。研究者开始更多地关注训练过程中的样本分配策略，而非一味地堆砌网络复杂度。随后的诸多工作，如PAA（Probabilistic Anchor Assignment）、OTA（Optimal Transport Assignment）等，都沿着ATSS开辟的方向继续深化。

从工程实践角度看，ATSS的简洁性使其易于集成到现有检测框架中。开发者只需修改训练时的样本分配模块，即可获得显著的性能提升，这种高性价比的改进在工业界尤其受欢迎。

样本选择作为目标检测的训练基础，其重要性怎么强调都不为过。ATSS通过自适应的统计方法，让模型能够根据每个目标的具体特性智能地选择训练样本，这种数据驱动的思路正是深度学习精神的真正体现。随着对训练 dynamics 理解的深入，我们有望看到更多像ATSS这样直击问题本质的简洁而有效的解决方案。

目标检测 ATSS 正负样本自适应训练样本选择检测性能 Anchor-based Anchor-free

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/40565/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权

ATSS：正负样本的选择如何决定检测性能

人生倒计时