文章详情页
python - 标签树的下行遍历如何跳过第一个标签
浏览:208日期:2022-08-08 11:07:17
问题描述
爬取网页用下行遍历的找出了我要的标签,但第一个的内容我是不要的用.children好像无法跳出第一个标签
for tr in soup.find(id='endText').children: if tr.string is not None:a = tr.string
网页的内容:
原链接:http://digi.163.com/14/1115/0...
问题解答
回答1:p_list = list(soup.find(id='endText').find_all(’p’))for p in p_list[1:]: text = p.get_text() img = p.find('img') if img:print img.get(’src’) if text:print text
相关文章:
1. 网页爬虫 - 关于Python的编码与解码问题2. css - 文字排版问题,内容都是动态抓出来的,字数不一定。如何对齐啊3. css3 - 微信前端页面遇到的transition过渡动画的bug4. selenium-selenium-webdriver - python 将当前目录加入到 环境变量5. javascript - html5 input file 如何限制只能调起图库和摄像头、不能选择其他类型的文件?6. css3 - 微信小程序如何把radio改成2个选择按钮的样式7. javascript - 为什么var obj = {}创建对象的方法里面不能用this.xxx来声明属性 ?8. redis - 究竟是选择微信小程序自带的统计工具还是自己开发一个数据统计的代码?9. javascript - postcss-loader在webpack2的使用.10. php ZipArchive关于不同目录文件压缩
排行榜

网公网安备