学习笔记:注意力机制 、自注意力(Self-Attention) (Multi-Head Attention) 多头...
32次收藏 发表时间:2025年12月17日
输入:给定一组输入数据(如文本的词向量序列、图像的特征图序列等 ),记为 X,其维度通常为 [序列长度,特征维度] ,可表示为 X=[x1,x2,…,xn] ,其中 xi 是第 i 个输入元素的特征向量。 生成 Q、...
CSDN博客频道
没有更多结果了~
- 意见反馈
- 页面反馈