如何使用Python 对缺失值进行处理
问题描述
最近项目一直在研究如何处理缺失值,因为拿来分析的数据多种多样,缺失值也占了一小部分,让人头痛的有两个问题:1.R语言里有一个专门处理缺失值的mice包,那么万能的Python里有没有相似的呢?2.如何对含有字符串类型的缺失值进行填充呢?聚类啊回归都是相对于数值型来说的,那么对于字符型有什么好的算法或者有什么好的封装的包来处理呢?求大神解答。PS:额,样例的话,比较不好描述,就如下:name,password,age,address张三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,钱六,,23,nanchang哈哈,123456,,lal啦啦,123123,,mmm
我们希望如R语言中的mice包一样,能使用Python很快的填充里面的缺失值(当然这个例子里面的信息关联性不大,但是要处理的数据里关联性比较多),再也如例子中,通过其他的属性,将属于字符串类型的address填充完整,就是第二个问题。
问题解答
回答1:#文本保存到1.txt,删除最后一行的address值name,password,age,address张三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,钱六,,23,nanchang哈哈,123456,,lal啦啦,123123,,
import pandas as pddf = pd.read_table(’1.txt’, header=0, sep=’,’)#添加一列df[’new’] = ’新值’#按当前行的其他列,填充address值df[’address’] = df.apply(lambda x: x[’new’] if pd.isnull(x[’address’]) else x[’address’], axis=1)print df回答2:
PyMICE is a Python® library for mice behavioural data analysis.你可以看看是不是你要的?https://neuroinflab.wordpress...http://neuroinflab.github.io/...
相关文章:
1. 管理员信息修改时的密码问题2. html5 - 为什么使使用vue cli 脚手架,post-css 没有自动对css3属性自动添加浏览器前缀呢?3. angular.js - 输入邮箱地址之后, 如何使其自动在末尾添加分号?4. android - RxJava 中有根据条件执行不同函数的操作符吗?5. javascript - 如何使用nodejs 将.html 文件转化成canvas6. java如何生成token?7. javascript - 后台管理系统左侧折叠导航栏数据较多,怎么样直接通过搜索去定位到具体某一个菜单项位置,并展开当前菜单8. javascript - html5的data属性怎么指定一个function函数呢?9. 如何解决docker宿主机无法访问容器中的服务?10. mysql - 电商如何存储营业额数据
