博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【数据处理3】:缺失值,数据规范化,相关系数,卡方检验
阅读量:3709 次
发布时间:2019-05-21

本文共 393 字,大约阅读时间需要 1 分钟。

缺失值的处理方法:

1,忽略元组

2,人工填写缺失值

3,使用全局变量填充空缺值

4,使用与给定元组属同一类所有样本的平均值

5,使用最可能的值填充缺失值,像使用贝叶斯公式或者是决策树

数据规范化的方法:

1,最小-最大规范化

这种方法没啥好说的,一个公式解决   V‘ = (v-minA)*(new_maxA-new_minA)/(maxA-minA);

2,z-score规范化

这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:

其中为所有样本数据的均值,为所有样本数据的标准差。

3,小数定标规范化

很简单的一个例子: -986变成 -0.986,让 A变成绝对值小于1的最大的跟A同构的数

多举几个: 72-------------》0.72 这下懂了吧? 

 

转载地址:http://xyyjn.baihongyu.com/

你可能感兴趣的文章
2020-12-08-LeetCode中“将数组拆分成斐波那契数列”题解
查看>>
2020-12-09-LeetCode中“不同路径”题解
查看>>
2020-12-09-LeetCode中“字符串中的第一个唯一字符”题解
查看>>
2020-12-13-LeetCode中“存在重复元素”题解
查看>>
2020-12-13-LeetCode中“环形链表”题解
查看>>
2020-12-23-LeetCode中“字符串中的第一个唯一字符”题解
查看>>
2020-12-29-LeetCode中“合并两个有序数组”题解
查看>>
2020-12-30-LeetCode中“最后一块石头的重量”题解
查看>>
2020-12-30-计算机组成与结构复习知识点总结
查看>>
2021-01-01-Vue中跳转页面传参总结
查看>>
2021-01-03-设解决使用hexo deploy推送代码到github仓库时重复输入账户密码
查看>>
2020-11-29-hexo博客搭建使用教程-进阶版
查看>>
Python数据分析库有哪些?
查看>>
Python学习:输入和输出
查看>>
Excel中find,left,iferror,right函数使用
查看>>
Excel下拉列表与数据筛选
查看>>
Excel学习 -- 数据透视表功能
查看>>
Excel中如何活用INDEX和MATCH函数
查看>>
Power BI 学习笔记(一)
查看>>
智能分析+每月生成 Power-BI图文报告解放双手!
查看>>