文章详情页
想写一个python分析统计apache 日志文件的脚本
浏览:251日期:2022-07-27 15:36:57
问题描述
想写一个python分析统计apache 网站日志文件并将统计后的数据存入mysql中的的脚本,有没有参考的,没有思路主要是统计 哪些url被爬取了 及 被爬取次数,以及IP这两个
问题解答
回答1:先把原始数据 规整化,然后 key 值自己定,然后用 collections 的 Counter 统计,然后再遍历写入 db, 大概代码如下:
data = [’/a 1.2.1.2’, ’/b 2.2.2.2’, ’/c 1.1.1.1’, ’/d 2.2.2.2’, ’/d 2.2.2.2’]from collections import Counterc = Counter(data)print c
Counter({’/d 2.2.2.2’: 2, ’/b 2.2.2.2’: 1, ’/a 1.2.1.2’: 1, ’/c 1.1.1.1’: 1})
你也可以自己维护字典,键为:/PATH:IP 或者什么,自己定,然后一边遍历,一边添加就好了
相关文章:
1. mysql - 这条sql语句为什么加上where就报错?2. python爬虫 - scrapy使用redis的时候,redis需要进行一些设置吗?3. ubuntu PPA 更新老是不成功该怎么办4. c++ - QWebEngineView加载url后直接点击链接没有反应要怎么解决?5. docker网络端口映射,没有方便点的操作方法么?6. jquery - 移动端如何写弹性效果7. android-studio - Android Studio编译出错8. nginx - 关于javaweb项目瘦身问题,前期开发后,发现项目占用存贮空间太大,差不多1.2个G,怎么实现瘦身,动态页面主要是jsp。9. angular.js - angular内容过长展开收起效果10. 请教关于jquery阻止冒泡的问题?
排行榜

网公网安备