a标签 url 正则怎么写(python 或者js)
问题描述
<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>
我要取 href里的链接
6个链接 前三个符合条件 正则怎么写(即链接中必须带有参数viewkey page viewtype category)
第二个和第三个链接相同 怎么去重复(python下)
问题解答
回答1:# python 2.7import rea = ’’’<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三个链接:
links= re.findall(r’href='https://www.haobala.com/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相关文章:
1. java - mybatis怎么实现在数据库中有就修改,没有就添加2. python - 求一个在def中可以实现调用本def满足特定条件continue效果的方法(标题说不太清楚,请见题内描述)3. MYSQL新建用户设置可以远程访问的问题4. $fields = $values = [];这条代码一直定义不了,一直报错,老师的源码也是被报错的,执行不了,请问该怎么解决这个问题5. node.js - nodejs和前端JavaScript 字符串处理结果不一样是什么原因?6. mysql 为何insert的时候会有lock wait timeout 异常7. mysql 5.7单表300万数据,性能严重下降,如何破?8. mysql同步数据到elasticsearch用什么工具?9. mysql - 我的myeclipse一直连显示数据库连接失败,不知道为什么10. 数据库 - mysql 远程可以连接,但是本地连接拒绝?
![$fields = $values = [];这条代码一直定义不了,一直报错,老师的源码也是被报错的,执行不了,请问该怎么解决这个问题](http://www.haobala.com/attached/image/news/202205/093622cb60.png)