a标签 url 正则怎么写(python 或者js)
问题描述
<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>
我要取 href里的链接
6个链接 前三个符合条件 正则怎么写(即链接中必须带有参数viewkey page viewtype category)
第二个和第三个链接相同 怎么去重复(python下)
问题解答
回答1:# python 2.7import rea = ’’’<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三个链接:
links= re.findall(r’href='https://www.haobala.com/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相关文章:
1. docker容器呢SSH为什么连不通呢?2. javascript - node.js后台设置token过期时间出现的问题3. yii2 - MySQL [23000] Column cannot be null4. css3动画 - css3 transition设置多个属性的时候不能只用逗号分隔?5. css - 关于父元素div滚动条不正确问题6. javascript - 页面滚动条出现时如何防止页面跳动7. nginx - 【win7】80 端口本机可访问,同内网其他机器不能访问,未被占用!8. javascript - 使用node multer如何上传文件到多台服务器?9. 主从复制 - redis主从, java客户端使用jedis连接master,读请求会被路由到slave吗?10. python - pip安装任何包都出现问题: Cannot unpack file /tmp/pip-KzJgHD-unpack/simple

网公网安备