文章详情页
想写一个python分析统计apache 日志文件的脚本
浏览:152日期:2022-07-27 15:36:57
问题描述
想写一个python分析统计apache 网站日志文件并将统计后的数据存入mysql中的的脚本,有没有参考的,没有思路主要是统计 哪些url被爬取了 及 被爬取次数,以及IP这两个
问题解答
回答1:先把原始数据 规整化,然后 key 值自己定,然后用 collections 的 Counter 统计,然后再遍历写入 db, 大概代码如下:
data = [’/a 1.2.1.2’, ’/b 2.2.2.2’, ’/c 1.1.1.1’, ’/d 2.2.2.2’, ’/d 2.2.2.2’]from collections import Counterc = Counter(data)print c
Counter({’/d 2.2.2.2’: 2, ’/b 2.2.2.2’: 1, ’/a 1.2.1.2’: 1, ’/c 1.1.1.1’: 1})
你也可以自己维护字典,键为:/PATH:IP 或者什么,自己定,然后一边遍历,一边添加就好了
相关文章:
1. javascript - 移动端一个小效果2. javascript - vue引入样式的问题3. javascript - 怎么实现让 div 里面的 img 元素 中心居中, 如下示例图4. javascript - nodejs调用qiniu的第三方资源抓取,返回401 bad token,为什么5. python - 关于beautifulsoup获取文档内容6. php - mysql 模糊搜索问题7. Mac环境下QT编译MySQL驱动屡次失败?如何?8. 微信开放平台 - ios APP能不能打开微信然后通过微信跳转到指定的URL?9. php - 微信开发验证服务器有效性10. javascript - vue+iview upload传参失败 跨域问题后台已经解决 仍然报403,这是怎么回事啊?
排行榜
![dockerfile - [docker build image失败- npm install]](http://www.haobala.com/attached/image/news/202311/1028105a80.png)