深度学习】各种注意力机制：encoder-decoder,self-attention,multi-head attention的区别

最新推荐文章于 2024-06-01 20:57:12 发布

土豆娃potato

最新推荐文章于 2024-06-01 20:57:12 发布

阅读量390

点赞数

分类专栏：日常学习文章标签：模型学习 CT图像基础知识开发语言

原文链接：https://blog.csdn.net/amusi1994/article/details/117491753

版权

日常学习专栏收录该内容

26 篇文章 1 订阅

订阅专栏

【深度学习】各种注意力机制：encoder-decoder,self-attention,multi-head attention的区别

- 转载 [各种注意力机制](https://zhuanlan.zhihu.com/p/376929247)
- 本次更新主要包含了三个方面：

转载各种注意力机制

在这里插入图片描述
论文：https://arxiv.org/abs/2105.02358

代码：https://github.com/MenghaoGuo/-EANet

本次更新主要包含了三个方面：

加入了 multi-head external attention 机制，multi-head external attention 也可以使用两个线性层实现，由于有了 multi-head external attention 结构，我们实现了一个 MLP 结构，我们把它叫做 EAMLP。

补充了一个 ablation study 的实验以及一些分析，可以更清楚的理解这种 external attention 机制。

补充了 COCO 上的 object detection 和 instance segmentation 的实验和 Tiny ImageNet 上的生成实验。现在已经在图像分类、检测、分割、实例分割、图像生成、点云的分割和分割上证明了 external attention 的有效性。
在这里插入图片描述
其他见原文：转载-剩下部分写的非常好

土豆娃potato

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习】各种注意力机制：encoder-decoder,self-attention,multi-head attention的区别

【深度学习】各种注意力机制：encoder-decoder,self-attention,multi-head attention的区别转载 [各种注意力机制](https://zhuanlan.zhihu.com/p/376929247)本次更新主要包含了三个方面：转载各种注意力机制论文：https://arxiv.org/abs/2105.02358代码：https://github.com/MenghaoGuo/-EANet本次更新主要包含了三个方面：加入了 multi-head ex
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。