How to fix this python code to count different sized (lenght) samples in an image?

在计算机视觉与图像处理领域，统计图像中不同尺寸的样本是一个常见需求。近日，有开发者在一技术论坛上提出了一个典型问题：“How to fix this python code to count different sized (length) samples in an image?”（如何修复这段Python代码，以统计图像中不同长度的样本？）本文将围绕该问题，解析可能存在的代码缺陷，并提供一套完整的解决方案。

问题背景

该用户希望利用Python编写一个脚本，能够读取一幅包含多个形状、大小各异的样本（如细胞、文字块、物体）的图像，随后统计出每种尺寸的样本数量。然而，其现有代码未能正确运行，可能的原因包括：图像预处理不足、轮廓检测参数不当、尺寸度量方式有误，或者计数逻辑存在Bug。类似问题在科研、工业质检及文档分析中屡见不鲜。

常见错误分析

为了“修复”代码，首先需定位错误。典型错误集中在以下几方面：

1. 图像读取与灰度化失误

如果直接使用彩色图像进行阈值处理，可能导致边缘检测失败。正确的做法是使用cv2.cvtColor()转换为灰度图，再应用高斯模糊减少噪声。

2. 轮廓检测参数不匹配

cv2.findContours()有多种模式（如RETR_EXTERNAL仅检测最外层轮廓，RETR_LIST检测所有轮廓）。若用户错用模式，可能遗漏内部样本或误将噪声视为样本。此外，cv2.CHAIN_APPROX_SIMPLE压缩轮廓点，可能影响尺寸计算精度。

3. 尺寸度量标准混乱

用户标题中的“length”（长度）往往指代样本的某个维度（如外接矩形边长、连通域直径或主轴长度）。代码中可能错误地使用了cv2.contourArea()作为长度，导致统计失真。正确做法是根据需求选择cv2.boundingRect()的宽高，或cv2.minAreaRect()的长宽，甚至使用cv2.fitEllipse()的长短轴。

4. 计数逻辑中的类型错误

若尝试将轮廓尺寸放入字典，但键（尺寸）使用了浮点数，直接作为字典键会导致精度问题——相同尺寸因微小浮点差异被视为不同。常见修复是先将尺寸四舍五入到整数，或使用round()设定精度。

修复方案与代码示例

下面提供一个修正后的Python脚本框架，该脚本基于OpenCV，能够统计不同尺寸样本的数量，并解决了上述常见问题。

import cv2
import numpy as np
from collections import Counter

def count_samples_by_size(image_path, size_metric='width', bins=None):
    # 读取图像并预处理
    img = cv2.imread(image_path)
    if img is None:
        raise FileNotFoundError("图像未找到")
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)

    # 自适应阈值或固定阈值
    _, thresh = cv2.threshold(blurred, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 查找轮廓
    contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # 过滤掉太小的轮廓（噪声）
    min_area = 50
    filtered_contours = [c for c in contours if cv2.contourArea(c) > min_area]

    # 计算每个样本的尺寸
    sizes = []
    for cnt in filtered_contours:
        if size_metric == 'width':
            # 使用外接矩形的宽度
            x, y, w, h = cv2.boundingRect(cnt)
            sizes.append(w)
        elif size_metric == 'height':
            x, y, w, h = cv2.boundingRect(cnt)
            sizes.append(h)
        elif size_metric == 'diagonal':
            # 使用外接圆直径
            (x, y), radius = cv2.minEnclosingCircle(cnt)
            sizes.append(int(2 * radius))
        elif size_metric == 'area':
            sizes.append(int(cv2.contourArea(cnt)))
        else:
            raise ValueError("不支持的尺寸度量")

    # 四舍五入到整数以避免浮点误差
    sizes = [round(s) for s in sizes]

    # 如果提供了分箱边界，则进行分箱处理
    if bins is not None:
        # bins: 如 [0, 50, 100, 200, 500] 表示区间
        binned = np.digitize(sizes, bins)
        # 结果字典：区间索引 -> 数量
        binned_count = Counter(binned)
        # 将区间映射为可读标签
        result = {}
        for i in range(len(bins) - 1):
            label = f"{bins[i]}-{bins[i+1]}"
            result[label] = binned_count.get(i+1, 0)
        # 超过最后一个边界的
        over = binned_count.get(len(bins), 0)
        if over > 0:
            result[f">{bins[-1]}"] = over
        return result
    else:
        # 直接按精确值计数
        return dict(Counter(sizes))

# 使用示例
if __name__ == "__main__":
    result = count_samples_by_size("sample_image.png", size_metric='width', bins=[0, 30, 60, 100])
    for size_range, count in sorted(result.items()):
        print(f"尺寸范围 {size_range}: {count} 个样本")

关键改进说明

预处理优化：采用OTSU自动阈值，并先高斯模糊，大幅提升轮廓检测稳定性。
灵活尺寸度量：通过参数size_metric可切换宽度、高度、直径、面积，避免硬编码。
浮点精度处理：使用round()将尺寸转为整数后计数，或将尺寸落入直方箱中，解决浮点键不一致问题。
噪声过滤：按面积过滤微小轮廓，减少误检。
分箱统计：提供可选的分箱功能，适合需要按尺寸范围（如“小、中、大”）统计的场景。

总结

统计图像中不同尺寸的样本，本质是“对象检测 + 尺寸量化”的过程。开发者常见的错误源于对OpenCV函数理解不足以及对数据类型的疏忽。通过合理的预处理、合适的轮廓模式、精确的尺寸计算以及稳妥的数据聚合，即可修复原始代码。上述脚本不仅解决了标题所述问题，还提供了一个可扩展的框架，用户可根据实际图像类型调整阈值、滤波参数与尺寸定义。在实践中，建议先对少量样本进行可视化调试，确认轮廓检测结果正确后再进行批量统计。

随着计算机视觉技术的普及，类似“如何修复Python代码”的问题将持续涌现。掌握从错误中学习、系统排查问题的方法，比直接获取一段完美代码更为重要。希望本文能为遇到此类困惑的开发者提供清晰的解决路径。