文章详情页
python该种情形下应该使用pickle还是csv
浏览:186日期:2022-07-01 10:52:25
问题描述
我手头有许多个上百M的csv存储一些数据,需要经常使用pandas和matplotlib对这些数据读取并进行绘图。在绘图之前,通常要进行预处理,切片等等清洗操作,因为要经常对figure进行交互操作和作报告,所以我在jupyter notebook中使用%matplotlib notebook进行操作和交互,我是将这些由原始数据产生的中间数据由csv保存,以便下次展示时直接读取csv获得中间数据,还是使用pickle保存,后续使用时读取pickle更快?
问题解答
回答1:肯定是csv安全啊,pickle似乎换一个python版本都可能导致读取失败的,这个不是通用格式。几百兆的话,csv其实读取速度不慢。更何况还有hdf5,这些才是正经的数据交换格式。
回答2:csv够用了,如果你觉得还不够快可以试试hdf5文件
相关文章:
1. 为什么我ping不通我的docker容器呢???2. debian - docker依赖的aufs-tools源码哪里可以找到啊?3. angular.js - angular内容过长展开收起效果4. dockerfile - 为什么docker容器启动不了?5. docker - 如何修改运行中容器的配置6. angular.js使用$resource服务把数据存入mongodb的问题。7. java - xml 传输数据如何处理更好8. javascript - h5上的手机号默认没有识别9. mac里的docker如何命令行开启呢?10. javascript - 用原生的js获取body和用jquery获取body的的margin值为什么不一样?
排行榜

网公网安备