简介

scipy.stat的一些研究
http://121.199.10.158:8107/c5p8d4he6gjkxm0oq1zrbslt2v37wify9aunx/mpan.x20kdf.zaksu-o021tvvtqw.com/Year2022/R22050_scipy_norm_cdf.html

三个函数分布的重要概念

概率密度函数 PDF, PMF
Continuous: Probability Density Functions, PDF
Discrete: Probability Mess Functions, PMF
累积分布函数 CDF
累积分布函数(Cumulative Distribution Function, CDF)，又叫分布函数，是概率密度函数的积分，能完整描述一个实随机变量X的概率分布。累积分布函数的导数 = 概率密度函数的函数值
概率密度函数 $f(x)$ 和累积分布函数 $F(x)$ ，即 $F'(x) = f(x)$ .
百分点函数 PPF
百分点函数(PPF: Percent Point Function)，是CDF的反函数，即 $ppf(X)=cdf^{-1}(X)$

若随机变量 $X$ 服从一个位置参数为 $\mu$ 、尺度参数为 $\sigma$ 的概率分布，且其概率密度函数为: $f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma}}$ 则这个随机变量就称为正态随机变量，正态随机变量服从的分布就称为正态分布，记作 $X \sim N(\mu, \sigma^2)$ ，读作 $X$ 服从 $N(\mu, \sigma^2)$ 的正态分布。当 $\mu=0, \sigma=1$ 时，正态分布就成为标准正态分布 $f(x) = \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$

s1 = '近日，有一个被用于文档攻击的样本被截获，该样本为伪装成word文件的RTF文件。通过分析该文档组合利用了cve-2017-11882和cve-2018-0802漏洞，并且使用内嵌的excel对象用于触发漏洞。释放的PE文件用于搜集目标用户的敏感信息。敏感信息通过邮件发送的方式回传。通过发送的标题“Hawkeye keylogger|Steal…”，怀疑该PE可能是著名的“Hawkeye Keylogger”漏洞，是一种窃取信息的恶意软件，作为恶意软件服务出售。'

# 显示字符串内容
for i in range(len(s1)):
    print(f'{i}:  {s1[i]}')
print(len(s1))

import matplotlib.pyplot as plt
import math

def f(x, sigma=8, mu=0):
    '''
    : 正态函数的概率密度函数
    : sigma 为偏移量，正向波峰向右移动，负值向左移动
    : mu    为幅度比例或宽度，值越大波峰越宽，越小越尖（向中间聚集）
    '''
    return 1 / (math.sqrt(2 * math.pi) * sigma) * math.pow(math.e, -(x - mu)**2 / (2 * sigma ** 2))

# 正态函数测试代码
# for i in range(-100, 100, 1):
#     x = i*0.01
#     print(f'{x:5.2f}    {f(x):.6f}')

# 用于存储数据和位置
vs, pos = [0] * len(s1), 0


def apply(s1, vs, pos, ae = 100):
    for i in range(ae):
        v = f(i)
        if pos + i < len(s1):
            vs[pos + i] += v
        if pos + i != pos - i and pos - i >= 0:
            vs[pos - i] += v

while pos < len(s1):
    try:
        # 递归找到所有漏洞并作用到vs中
        pos = s1.index('漏洞', pos)
        apply(s1, vs, pos)
        print(pos)
        pos += 1
    except:
        break

plt.plot(vs)
plt.show()