Python爬蟲實現(xiàn)百度翻譯功能過程詳解
首先,需要簡單的了解一下爬蟲,盡可能簡單快速的上手,其次,需要了解的是百度的API的接口,搞定這個之后,最后,按照官方給出的demo,然后寫自己的一個小程序
打開瀏覽器 F12 打開百度翻譯網(wǎng)頁源代碼:
我們可以輕松的找到百度翻譯的請求接口為:http://fanyi.baidu.com/sug
然后我們可以從方法為POST的請求中找到參數(shù)為:kw:job(job是輸入翻譯的內(nèi)容)
下面是代碼部分:
from urllib import request,parseimport jsondef translate(content): url = 'http://fanyi.baidu.com/sug' data = parse.urlencode({'kw':content}) # 將參數(shù)進行轉(zhuǎn)碼 headers = { ’User-Agent’: ’Opera/9.80 (Android 2.3.4; Linux; Opera Mobi/build-1107180945; U; en-GB) Presto/2.8.149 Version/11.10’ } req = request.Request(url,data=bytes(data,encoding='utf-8'),headers=headers) r = request.urlopen(req) # print(r.code) 查看返回的狀態(tài)碼 html = r.read().decode(’utf-8’) # json格式化 html = json.loads(html) # print(html) for k in html['data']: print(k['k'],k['v'])if __name__ == ’__main__’: content = input('請輸入您要翻譯的內(nèi)容:') translate(content)
結(jié)果如下
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. XML入門的常見問題(三)2. XML基本概念XPath、XSLT與XQuery函數(shù)介紹3. WML的簡單例子及編輯、測試方法第1/2頁4. el-input無法輸入的問題和表單驗證失敗問題解決5. 關(guān)于html嵌入xml數(shù)據(jù)島如何穿過樹形結(jié)構(gòu)關(guān)系的問題6. CSS3實例分享之多重背景的實現(xiàn)(Multiple backgrounds)7. 不要在HTML中濫用div8. vue實現(xiàn)復(fù)制文字復(fù)制圖片實例詳解9. XML入門的常見問題(四)10. 前端html+css實現(xiàn)動態(tài)生日快樂代碼
