import torch
import torch.nn as nn
import numpy as np

class dot_attention(nn.Module):
""" 点积注意力机制"""

def __init__(self, attention_dropout=0.0):
super(dot_attention, self).__init__()
self.dropout = nn.Dropout(attention_dropout)
self.softmax = nn.Softmax(dim=2)

def forward(self, q, k, v, scale=None, attn_mask=None):
"""
前向传播
:param q:
:param k:
:param v:
:param scale:
:return: 上下文张量和attention张量。
"""
attention = torch.bmm(q, k.transpose(1, 2))
if scale:
attention = attention * scale        # 是否设置缩放
# 计算softmax
attention = self.softmax(attention)
# 添加dropout
attention = self.dropout(attention)
# 和v做点积。
context = torch.bmm(attention, v)
return context, attention

if __name__ == '__main__':
q = torch.ones((1, 2, 512))
k = torch.ones((1, 17, 512))
v = k
attention = dot_attention()
context, attention = attention(q, k, v)
print("context:", context.size(), context)
print("attention:", attention)

• PyTorch 对应点相乘、矩阵相乘

一，对应相乘，x.mul(y) ，即点乘操作，点乘不求和操作，又可以叫作Hadamard product；点乘再求和，即为卷积 data = [[1,2], [3,4], [5, 6]] tensor = torch.FloatTensor(data) tensor Out[27]: tensor([[ 1.,...
一，对应点相乘，x.mul(y) ，即点乘操作，点乘不求和操作，又可以叫作Hadamard product；点乘再求和，即为卷积
>>> a = torch.Tensor([[1,2], [3,4], [5, 6]])
>>> a
tensor([[1., 2.],
[3., 4.],
[5., 6.]])
>>> a.mul(a)
tensor([[ 1.,  4.],
[ 9., 16.],
[25., 36.]])

# a*a等价于a.mul(a)

二，矩阵相乘，x.mm(y) ， 矩阵大小需满足： (i, n)x(n, j)
>>> a
tensor([[1., 2.],
[3., 4.],
[5., 6.]])
>>> b = a.t()  # 转置
>>> b
tensor([[1., 3., 5.],
[2., 4., 6.]])

>>> a.mm(b)
tensor([[ 5., 11., 17.],
[11., 25., 39.],
[17., 39., 61.]])


Numpy & PyTorch知识点总结
前言Numpy1.np.random模块常用函数2.Numpy数组创建函数3.Numpy算术运算4.Numpy中改变向量形状的函数5.合并数组6.Numpy中的几个常用通用函数7.Numpy广播机制
PyTorch概述1.Pytorch主要包组成：2.PyTorch与Numpy区别

1.创建Tensor2.修改Tensor的形状3.常用选择操作函数4.常见逐元素操作5.常见归并操作6.常见比较操作7.常用矩阵函数8.PyTorch与Numpy函数对照表

前言
最近在学习PyTorch，发现PyTorch的tensor与Numpy有不少的相似点，于是重新系统的复习了一下Numpy，并在记录想两者的一些知识点，以备不时之需。
Numpy
1.np.random模块常用函数

np.random.random([3, 3]) #生成3行3列0到1之间随机数
np.random.randn(2, 3)    #生成2行3列标准正态分布随机数

2.Numpy数组创建函数

#补充
np.arrange([start,] stop[,step],dtype=None)
np.linspace(start, stop, num=50,endpoint=True, retstep=False, dtype=None) #自动生成线性等分向量

3.Numpy算术运算
1.np.multiplay：数组或矩阵对应元素相乘，输出与相乘数组或矩阵大小一致。  2.np.dot()：內积
4.Numpy中改变向量形状的函数
补充：transpose在深度学习中常用将图片中表示颜色顺序的RGB改为GBR
5.合并数组

6.Numpy中的几个常用通用函数
（PS：numpy函数比math函数速度更快）
7.Numpy广播机制
当数组的shape不相等时，Numpy会使用广播机制。广播规则：
1）让所有输入数组都向其中shape最长的数组看齐，不足的部分则通过在前面加1补齐，如：
a：2×3×2
b：3×2
则b向a看齐，在b的前面加1，变为：1×3×2
2）输出数组的shape是输入数组shape的各个轴上的最大值；
3）如果输入数组的某个轴和输出数组的对应轴的长度相同或者某个轴的长度为1时，这个数组能被用来计算，否则出错；
4）当输入数组的某个轴的长度为1时，沿着此轴运算时都用（或复制）此轴上的第一组值。


PyTorch
概述
1.Pytorch主要包组成：
2.PyTorch与Numpy区别
1.创建Tensor
（torch.Tensor与torch.tensor区别： 1.当传入数据时，torch.Tensor使用全局默认dtype（FloatTensor），而torch.tensor是从数据中推断数据类型； 2.torch.tensor(1)返回一个固定值1，而torch.Tensor(1)返回一个大小为1的张量，它是随机初始化的值）
2.修改Tensor的形状

3.常用选择操作函数

4.常见逐元素操作

5.常见归并操作

6.常见比较操作

7.常用矩阵函数

8.PyTorch与Numpy函数对照表
注：本文根据微信读书《Python深度学习：基于PyTorch》整理。 链接: Python深度学习：基于PyTorch.
一、PyTorch 是什么
PyTorch是一个基于Python的科学计算包，相比numpy能使用GPU来加快计算。
二、基本语法
介绍pytorch基本知识，对pytorch有基本的了解，构建基本的神经网络。主要参考pytorch官方教程。
2.1 张量（Tensors）
创建Tensor
函数说明torch.tensor(data )赋值torch.arange(start,end,step=1,out=None)torch.zeros(*sizes )全部生成为0torch.clone()torch.ones(*sizes )全部生成为1torch.eye(n,m=None,out=None)返回一个2维张量，对角线位置全为1，其他位置全0torch.from_numpy(ndarray)tensor和numpy的转换torch.linspace(start, end, steps=100, out=None)返回一个1维张量，包含在区间start和end上均匀间隔的step个点。torch.logspace(start,end,steps=100.out=None)设置的区间为常用对数，输出的值为其对应的真数
创建随机Tensor
函数说明torch.rand(*sizes, out=None)从区间[0, 1)的均匀分布中抽取的一组随机数torch.randperm(n,out=None)返回一个从0到n-1的随机整数排列torch.randn(*sizes, out=None)从标准正态分布（均值为0，方差为1，即高斯白噪声）中抽取的一组随机数torch.normal(means, std, out=None)指定均值means和标准差std的离散正态分布中抽取的一组随机数。uniform(from,to)均匀分布
常用Tensor操作
函数说明view(*shape)调整tensor的形状,与源tensor共享内存torch.squeeze(input, dim=None, out=None)删除尺寸1的输入的所有尺寸的张量torch.unsqueeze(input, dim, out=None)插入在指定位置的尺寸标注尺寸的新张量。resize修改tensor的尺寸None添加一个轴a > 1返回一个bool矩阵gather(input, dim, index)根据index，在dim维度上选取数据，输出的size与index一样index_select(input, dim, index)在指定维度dim上选取，比如选取某些行、某些列masked_select(input, mask)例子如上，a[a>0]，使用ByteTensor进行选取non_zero(input)非0元素的下标
数值计算
函数说明abs/sqrt/div/exp/fmod/log/pow…绝对值/平方根/除法/指数/求余/求幂…cos/sin/asin/atan2/cosh…相关三角函数ceil/round/floor/trunc上取整/四舍五入/下取整/只保留整数部分clamp(input, min, max)超过min和max部分截断sigmod/tanh…激活函数torch.lerp(star, end, weight)返回结果是out= star t+ (end-start) * weighttorch.equal(torch.Tensor(a), torch.Tensor(b))两个张量进行比较，如果相等返回true，否则返回falsetorch.max(input)返回输入元素的最大值mean/sum/median/mode均值/和/中位数/众数norm/dist范数/距离std/var标准差/方差cumsum/cumprod累加/累乘gt/lt/ge/le/eq/ne大于/小于/大于等于/小于等于/等于/不等topk最大的k个数sort排序max/min比较两个tensor最大最小值
线性代数计算
2.3 构建神经网络
三、常用函数
索引，切片，连接，换位
|.torch.transpose(input, dim0, dim1)|转置| |.torch.masked_select(input, mask, out=None) |根据二进制掩码对输入进行索引，这是一个新的索引| |torch.chunk(tensor, chunks, dim=0) |将张量拆分为特定数量的“块”| |torch.narrow(input, dimension, start, length)| |torch.stack(seq, dim=0, out=None) |拼接|
参考文献： pytorch官网 深度学习框架pytorch：入门与实践 PyTorch 深度学习:60分钟快速入门 torch—pytorch常用函数 Pytorch常用函数操作总结
• 矩阵乘法、克罗内克、哈达马则是矩阵论中的概念，强调的是更为一般性的n维向量的运算规则，矩阵内操作向量在内积空间中的矩阵乘法。 矩阵乘法是使用最多的运算，比如在 torc h中 * 、@、mm函数。点乘可以视...
