Attention机制
郝伟 2020/012/12
Attention 正在被越来越广泛的得到应用,其中比较著名的就是 BERT 的火爆。
Attention(注意力)机制如果浅层的理解,跟他的名字非常匹配。他的核心逻辑就是「从关注全部到关注重点」,即将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。
之所以要引入 Attention 机制,主要是3个原因:
具体示例:https://blog.csdn.net/weixin_43145361/article/details/106781801