如何在Win10系統(tǒng)使用Python3連接Hive
由于數(shù)據(jù)存放在大數(shù)據(jù)平臺的Hive數(shù)據(jù)倉庫中,我需要在Win10系統(tǒng)上利用Python3連接Hive,然后讀取數(shù)據(jù),進行探索、分析和挖掘工作。

我通過網(wǎng)上查找資料和實際測試,把Win10系統(tǒng)Python3成功連接Hive配置總結(jié)如下。
第一步:安裝依賴庫
pip install bitarraypip install bit_arraypip install thriftpip install thriftpypip install pure_saslpip install --no-deps thrift-sasl==0.2.1
提示:若是無法安裝,也可以點擊如下網(wǎng)址,
https://www.lfd.uci.edu/~gohlke/pythonlibs/
選擇合適庫的whl下載,然后進行本地化安裝。
第二步:安裝impyla庫
我采用本地化安裝方式,先下載impyla庫的whl,如下圖:

再安裝
pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl
提示:上面的絕對路徑根據(jù)你自己的情況而定
第三步:測試impyla庫是否可以使用
from impala.dbapi import connect #用來連接Hive的函數(shù)from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandas
若是運行通過,表示利用impala連接Hive配置成功。
簡單示例:
從Hive的一張表讀取100條記錄,放到pandas的DataFrame里面。
參考代碼:
from impala.dbapi import connect #用來連接Hive的函數(shù)from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandasconn = connect(host=’my.host.com’, port=21050)cursor = conn.cursor()cursor.execute(’SELECT * FROM mytable LIMIT 100’)df = as_pandas(cursor)cursor.close()
參考資料
https://github.com/cloudera/impyla
以上就是如何在Win10系統(tǒng)使用Python3連接Hive的詳細內(nèi)容,更多關(guān)于Python3連接Hive的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. Win11怎么設置本地密碼?Win11設置本地密碼操作方法2. Win10開始菜單透明度如何設置?Win10開始菜單透明度設置教程3. Win10系統(tǒng)的Edge瀏覽器怎么進行長截圖?4. Win11系統(tǒng)自動暫停更新后想繼續(xù)怎么辦?Win11系統(tǒng)重新啟動更新教程5. windows10分辨率在哪里調(diào)試6. Win11電腦不顯示盤符怎么辦?Win11硬盤盤符不顯示的解決方法7. Win7電腦注冊表編輯器被管理員禁用怎么解決?8. Win11打印機怎么安裝?Win11系統(tǒng)安裝共享打印機教程9. win11任務管理器怎么打開 被管理員禁用了怎么解禁打開10. Win10專業(yè)版系統(tǒng)電腦找不到音頻設備怎么辦?

網(wǎng)公網(wǎng)安備