网站建设合同包含什么,企业申请域名,网络培训心得,建设一个企业网站要多少钱目录 观看地址介绍什么是显著性目标检测根据不同的输入会有不同的变体(显著性目标检测家族)目前这个领域的挑战 技术方案论文1(2019)论文2(2021)论文3(2022) 未来展望 观看地址
b站链接
介绍
什么是显著性目标检测
一张图片里最吸引注意力的部分就是显著性物体#xff0c;… 目录 观看地址介绍什么是显著性目标检测根据不同的输入会有不同的变体(显著性目标检测家族)目前这个领域的挑战 技术方案论文1(2019)论文2(2021)论文3(2022) 未来展望 观看地址
b站链接
介绍
什么是显著性目标检测
一张图片里最吸引注意力的部分就是显著性物体其实是模拟人的一个注意力机制。目标是希望通过计算机的方法让我们自动定位和模拟人的这种感知能力从而去定位场景中的一个让人感兴趣的目标
根据不同的输入会有不同的变体(显著性目标检测家族)
在RGB的基础上引入一个景深信息——RGBD显著性目标检测相关性的一个图像组的数据引入图间关系——协同显著性目标检测引入运动、帧间关系等——视频显著目标检测引入多视角的关系形成一个相机阵列来计算光场图像中的显著性物体——光场显著性目标检测摄像机架设到天上俯视成像——光学遥感图像显著性目标检测
目前这个领域的挑战
成像条件不同从天空往下拍的过程中会存在很多干扰比如云层、遮挡光照(一个区域亮另一个区域暗)、重影(光照导致)并且场景范围比较宽大的也就存在目标场景、背景复杂比如树木阴影这样的干扰。高空往下拍目标整体的尺寸大小会参差不齐比如拍的体育馆体育馆比较大容易检测拍的舰船舰船比较小不容易检测尺度变化是非常大的。场景范围足够大比如沙漠上去拍就可能不存在显著性目标
技术方案
论文1(2019)
这篇论文是第一篇深度学习在遥感显著性检测的论文并构建了第一个开源数据集ORSSD 主要贡献
双流金字塔结构L形状。学习互补特征。输入尺寸进行不同程度的下采样让场景能够去捕获不同尺寸的特征图信息。嵌套连接的编码器和解码器结构V形状。在编解过程中实现特征筛选而不是一股脑直接concat
论文2(2021)
论文1的继承想法是传统是特征由前一层往后传但是真的有必要去传这样所有特征吗特征融合完后可能存在一些冗余为了更高效的传递论文提出了注意力密集传递扩充了第一个数据集并命名为EORSSD 主要贡献
DAF(密集注意力流)结构可以进一步解耦成特征提取以及全局上下文注意力这么一个模块不光结合多尺度和多层次的线索还产生了流动dense的结构来实现不同层次之间信息的高效的一个传递和交互。GCA(全局上下文注意力)模块可以拆分为GFA(全局特征集成)和CPA(级联金字塔注意力)模块GFA主要是编码全局上下的一个信息去解决目标检测不完整的问题。CPA主要解决目标尺度多样化的问题。在遥感显著性目标检测中一些细长的河流容易检测不全被打散原因可能是局部感受野非常难去捕获到一个区域与另外一个远端区域之间的关系。也就是这个卷积核的感受野太窄了是在一个有限的范围去学习特征。GFA通过建模长程依赖关系来计算概念是一个目标如果是显著的那么其和目标整体内部的特性是相近的也就是说一个像素点的位置和其他所有像素点位置进行一个相关性的求解后得到全局上下文这样的一个依赖关系矩阵器用这个信息来对原始特征进行加权把全局上下文的关系编码到特征里去。 通道注意力来得到更紧致的通道信息 空间注意力来强调重要的区域位置对应在哪里
论文3(2022)
本片论文在全局上下文的计算方式使用的是关系感知关系推理来做引入graph(图推理)这种解决方案 主要贡献
图推理是在高层后三层进行实现并且不止局限于空间维度上的推理其在通道维度上也实现了推理。把一个特征建模成多个节点通过把不同节点之间进行关联之后去学习边上的一个权重模拟特征节点之间的相似性进而去推断去实现推理这个功能。解码过程中在靠近结果输出最后两层中更加需要从编码器提取有效信息来对细节进行恢复对结果进行修正去抵抗目标尺寸变化的问题。通过attention图去挑选一些有用信息来指导我们的解码。一个分支是注意力用不同大小的卷积核另一个分支是卷积用不同大小卷积核再过统一核大小的注意力块。相当于通过穷尽法来模拟得到多尺度注意图的这种方式。
未来展望
根据新的数据集做更好的研究更挑战的内容学习方法不一定要全监督可以用弱监督小样本的方式来摆脱对GT的依赖做一些扩展比如instance level做一个即插即用的模块改善显著性检测进一步提升性能