异常检测算法

2024-07-21 1724阅读

目录

  • 一、异常检测算法功能:
  • 二、正态(高斯)分布:
  • 三、异常检测算法执行过程:
  • 四、如何选择特征:
  • 五、评估异常检测算法:

    一、异常检测算法功能:

    异常检测算法用来检测数据集中的一些异常样本。

    异常检测算法属于非监督模型,即没有明确的标签值。

    二、正态(高斯)分布:

    使用高斯分布来对数据集中的每个特征进行概率建模,每个特征xi各自生成一个高斯函数。

    对于特征xi,若输入x,高斯函数计算输出的是该取值x在特征xi所有训练集值中出现的概率,通过概率来检测该取值是否异常,从而判断该样本是否异常。

    异常检测算法

    • 参数μ(均值)控制分布的中心位置,而参数σ(标准差)控制分布的扁平度。
      • 当μ增大时,高斯分布整体向右平移。
      • 当σ增大时,高斯分布会变得更加扁平。

        异常检测算法

        三、异常检测算法执行过程:

        异常检测算法

        • 1.选定可能会出现异常的n各特征xi。
        • 2.对每个特征xi单独计算其μ和σ构造高斯函数。
        • 3.输入待检测样本x,将样本的每个特征各自输入相应的高斯函数计算各特征的正常概率。
        • 4.各个特征的概率乘积即为该样本的正常概率。
        • 5.若正常概率小于预设值ε,则表明该样本中的特征值是异常的。

          四、如何选择特征:

          • 选择尽量符合高斯分布(钟形曲线)的特征。
          • 对于不符合高斯分布的特征,通过线性或非线性变换将特征变换后的分布符合高斯分布。

            五、评估异常检测算法:

            尽管异常检测算法是非监督模型,但是我们可以通过引入标签值来进行算法的评估:

            对于部分已经确定异常的样本,我们将其标签设为“异常1”。然后将这部分样本划分为测试集和交叉验证集,分别在算法训练时、训练后进行算法预测性能的评估,交叉验证算法还可以调整ε等参数的值。

VPS购买请点击我

免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

目录[+]