a标签 url 正则怎么写(python 或者js)
问题描述
<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>
我要取 href里的链接
6个链接 前三个符合条件 正则怎么写(即链接中必须带有参数viewkey page viewtype category)
第二个和第三个链接相同 怎么去重复(python下)
问题解答
回答1:# python 2.7import rea = ’’’<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三个链接:
links= re.findall(r’href='https://www.haobala.com/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相关文章:
1. java - 触发器使两张表同时更新2. angular.js使用$resource服务把数据存入mongodb的问题。3. 电脑上装了wamp后,再装了mysql,wamp上的mysql就不能用了4. 新建index文件夹,然后把controller 以及文件index.php放入index文件夹。修改htaccess文件为扩展访问。但是访问的时候提示页面错误!请稍后再试。PHP版本正常,请老师解答5. java - mysql缓存问题6. 请问一下,图片上传成功,但是后台对应文件夹里面却没有图片,这是什么原因?(已部署到服务器)7. mysql - 千万级数据表如何有效的变更字段?8. php - SQL 一条语句查询出文章和对应的文章标签9. PHP搜索功能的实现 哪里错了10. php+mysql 高并发 根据id 循环下载数据如何避免重复 (接口)

网公网安备