html - Python2 BeautifulSoup 提取网页中的表格数据及连接
问题描述
网址:http://quote.eastmoney.com/ce...要做的是提取网页中的表格数据(如:板块名称,及相应链接下的所有个股,依然是个表格)
暂时只写了这些代码:import urllib2from bs4 import BeautifulSoup
url=’http://quote.eastmoney.com/ce...’
req=urllib2.Request.(url)page=urllib2.urlopen(req)
soup=BeautifulSoup(page)table = soup.find('table')
但是table里面没有内容,也就是完全没找到,这是怎么回事啊。po是小白,希望大神们可以多多指教,谢谢!
问题解答
回答1:因为是异步加载,数据在这里http://nufm.dfcfw.com/EM_Fina...
# coding:utf-8import requestsr = requests.get(’http://nufm.dfcfw.com/EM_Finance2014NumericApplication/JS.aspx?type=CT&cmd=C._BKGN&sty=FPGBKI&st=c&sr=-1&p=1&ps=5000&token=7bc05d0d4c3c22ef9fca8c2a912d779c&v=0.12043042036331286’)data = [_.decode(’utf-8’).split(’,’) for _ in eval(r.text)]url = ’http://quote.eastmoney.com/center/list.html#28003{}_0_2’lst = [(url.format(_[1].replace(’BK0’, ’’)), _[2]) for _ in data]print lst
相关文章:
1. 前端 - html5 audio不能播放2. java固定键值转换,使用枚举实现字典?3. vim - win10无法打开markdown编辑器4. mysql - 千万数据 分页,当偏移量 原来越大时,怎么优化速度5. 如何解决tp6在zend中无代码提示6. javascript - 有没有类似高铁管家的时间选择插件7. 这是什么情况???8. python - flask学习,user_syy添加报role is invalid keyword for User.9. css - BEM 中块(Block)有木有什么标准 何时决定一个部分提取为块而不是其父级的元素呢(Element)?~10. javascript - 微信网页开发从菜单进入页面后,按返回键没有关闭浏览器而是刷新当前页面,求解决?
