简历面试准备
一、U-2-Net
(一)SOD任务
显著性目标检测Salient Object Detection,相当于语义分割中的二分类任务,只有前景和背景
(二)网络结构
下图为U-2-Net的整体结构

提示
residual [rɪˈzɪdjuəl]
在encoder阶段,每个block之后使用maxpooling下采样两倍 在decoder阶段,每个block之后使用双线性插值上采样两倍
下图为Residual U-block的结构

提示
在特征融合阶段,每一层的encoder-decoder输出,使用3x3卷积以及双线性插值上采样到原始分辨率得到该层的特征图,且卷积核的个数为1,输出的feature map通道数也为1。将每一层的feature map进行concat拼接,得到6通道的融合feature map,最后使用1x1卷积以及sigmoid激活函数得到最终的融合特征图输出
(三)损失函数
损失函数是7个损失项的加权求和 共有6层encoder-decoder结构,将每一层对应的feature map与ground truth做BCE Loss得到6个损失项 第7个损失项是最终融合得到的feature map与ground truth的BCE Loss 在论文中,每个损失项的权重都为1
canny边缘检测:
- 使用高斯滤波进行平滑
- 计算像素梯度
- 非极大值抑制
- 双阈值检测强边缘、弱边缘
- 边缘连接
