文章詳情頁
想寫一個python分析統計apache 日志文件的腳本
瀏覽:240日期:2022-07-27 15:36:57
問題描述
想寫一個python分析統計apache 網站日志文件并將統計后的數據存入mysql中的的腳本,有沒有參考的,沒有思路主要是統計 哪些url被爬取了 及 被爬取次數,以及IP這兩個
問題解答
回答1:先把原始數據 規整化,然后 key 值自己定,然后用 collections 的 Counter 統計,然后再遍歷寫入 db, 大概代碼如下:
data = [’/a 1.2.1.2’, ’/b 2.2.2.2’, ’/c 1.1.1.1’, ’/d 2.2.2.2’, ’/d 2.2.2.2’]from collections import Counterc = Counter(data)print c
Counter({’/d 2.2.2.2’: 2, ’/b 2.2.2.2’: 1, ’/a 1.2.1.2’: 1, ’/c 1.1.1.1’: 1})
你也可以自己維護字典,鍵為:/PATH:IP 或者什么,自己定,然后一邊遍歷,一邊添加就好了
相關文章:
1. 運行python程序時出現“應用程序發生異常”的內存錯誤?2. macos - 無法source activate python273. css3 讓圖片變成灰色(filter),但針對IE11瀏覽器無效4. java - butterknife怎么綁定多個view5. java - 同步/異步與阻塞/非阻塞之間的差異具體是什么?6. android - Genymotion 模擬器可以做屏幕適配檢測嗎?7. html5 - 前端面試碰到了一個緩存數據的問題,來論壇上請教一下8. javascript - 打算寫一個c++的node圖像處理模塊,有沒有推薦的c++圖片處理庫?9. html - vue里面:src在IE(9-11)下不顯示圖片10. 我在導入模板資源時遇到無法顯示的問題,請老師解答下
排行榜

網公網安備