文章详情页

python - 请问如何可以优化提升pandas的read_sql的速度呢？

浏览：249日期：2022-06-27 16:28:52

问题描述

小弟的需求需要在多个数据库之间查询数据并关联，所以小弟选择了使用pandas，通过read_sql读取数据至dataframe加工后直接生成目标数据。但是目前遭遇了一个问题：read_sql的速度非常慢，例如，在oracle库中读取37W数据量（22个字段）的表至dataframe耗时需要4分半。代码如下：

import pandas as pdimport sqlalchemy as sqlora_engine=sql.create_engine(’oracle://test01:test01@test01db’)ora_df1=pd.read_sql(’select * from target_table1’,ora_engine)

耗时4分32秒

甚至小弟使用另外一个简单粗暴的方法都会比read_sql快很多。代码如下：

import pandas as pdimport sqlalchemy as sqlora_engine=sql.create_engine(’oracle://test01:test01@test01db’)conn=ora_engine.raw_connection()cursor=conn.cursor()queryset=cursor.execute(’select * from target_table1’)columns=[for i[0] in queryset.description]df_data=queryset.fetchall()ora_df1=pd.DataFrame()ora_df1.columns=columnsora_df1.append(df_data)

耗时1分31秒

这里想请教一下各位大大，有什么方法可以优化提升pandas的read_sql的速度，非常感谢大家~

问题解答

回答1：

试试read_sql_tablehttp://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_sql_table.html#pandas.read_sql_table

Python 编程

上一条：python - 使用pyhive 能够执行source 语句吗下一条：Python从URL中提取域名

相关文章：

1. docker 17.03 怎么配置 registry mirror ?2. tp6 事务闭包操作问题3. python打开.py文件的时候出现window无法打开该文件是怎么回事呢？4. 主从复制 - MySQL 主从延迟 300s 以上，求大神解答5. docker gitlab 如何git clone？6. web服务器 - ubuntu下布置apache加wsgi加python7. css - 图片的宽度发生变化而高度却没有相应变？8. dockerfile - 为什么docker容器启动不了？9. javascript - sublime快键键问题10. javascript - 微信小程序如何实现这种左滑动出现删除的办法？有相关api吗？

排行榜

					
					javascript - 微信小程序 如何实现这种左滑动出现删除的办法？有相关api吗？
javascript - sublime快键键问题
主从复制 - MySQL 主从延迟 300s 以上，求大神解答
dockerfile - 为什么docker容器启动不了？
docker gitlab 如何git clone？
python打开.py文件的时候出现window无法打开该文件是怎么回事呢？
web服务器 - ubuntu下布置apache加wsgi加python
tp6 事务闭包操作问题
css - 图片的宽度发生变化而高度却没有相应变？
docker 17.03 怎么配置 registry mirror ?
java - 单例服务解决多进程写文件
				

热门标签