如何在Win10系统使用Python3连接Hive
由于数据存放在大数据平台的Hive数据仓库中,我需要在Win10系统上利用Python3连接Hive,然后读取数据,进行探索、分析和挖掘工作。
我通过网上查找资料和实际测试,把Win10系统Python3成功连接Hive配置总结如下。
第一步:安装依赖库
pip install bitarraypip install bit_arraypip install thriftpip install thriftpypip install pure_saslpip install --no-deps thrift-sasl==0.2.1
提示:若是无法安装,也可以点击如下网址,
https://www.lfd.uci.edu/~gohlke/pythonlibs/
选择合适库的whl下载,然后进行本地化安装。
第二步:安装impyla库
我采用本地化安装方式,先下载impyla库的whl,如下图:
再安装
pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl
提示:上面的绝对路径根据你自己的情况而定
第三步:测试impyla库是否可以使用
from impala.dbapi import connect #用来连接Hive的函数from impala.util import as_pandas #用来把数据结构转换为pandas
若是运行通过,表示利用impala连接Hive配置成功。
简单示例:
从Hive的一张表读取100条记录,放到pandas的DataFrame里面。
参考代码:
from impala.dbapi import connect #用来连接Hive的函数from impala.util import as_pandas #用来把数据结构转换为pandasconn = connect(host=’my.host.com’, port=21050)cursor = conn.cursor()cursor.execute(’SELECT * FROM mytable LIMIT 100’)df = as_pandas(cursor)cursor.close()
参考资料
https://github.com/cloudera/impyla
以上就是如何在Win10系统使用Python3连接Hive的详细内容,更多关于Python3连接Hive的资料请关注好吧啦网其它相关文章!
相关文章:
1. Windows11下载卡着不动怎么办?Windows11下载卡着不动解决方法2. Win10如何隐藏任务栏?Win10隐藏任务栏的方法3. CentOS7中无法找到pci find device函数的解决方法4. 统信UOS家庭版开始内测 无需分区全自动安装5. virbr0虚拟网卡如何卸载?virbr0虚拟网卡的卸载方法6. 谨慎升级 macOS Ventura 13.3/iPadOS 16.4更新后Universal Control故障7. deepin20桌面图标样式怎么修改? deepin更换图标主题的技巧8. Winxp系统如何添加虚拟网卡?9. centos7使用docker部署gitlab-ce-zh应用详解10. Win11 USB接口不能用怎么办? Win11电脑USB接口没反应的解决办法
