python中的一个用法不清楚
问题描述
在python编写爬虫的过程中(爬取wiki百科的词条),使用迭代器输出过程中出现了url['href']想着应该属于迭代器里面一个用法,但却没有找到,求助这个用法的意思,谢谢
#coding:utf-8import urllibimport urllib2import refrom bs4 import BeautifulSoupresp = urllib2.urlopen('https://en.wikipedia.org/wiki/Main_Page').read()soup = BeautifulSoup(resp,'html.parser')listurl = soup.findAll(’a’,href=re.compile('^/wiki/'))for url in listurl:print url.get_text(),'------>','https://en.wikipedia.org'+url['href']
最后一行的url['href'],对爬取得数据产生了截断的效果,没加之前,输出为:print url输出:Disclaimers加了之后,输出为:print url['href']输出:/wiki/Wikipedia:General_disclaimer求解,谢谢
问题解答
回答1:只要实现了__getitem__方法的类就可以使用中括号取值。
In [16]: class A(): ...: def __getitem__(self,a): ...: return a ...: In [17]: a = A() In [18]: a[’a’], a[1] Out[18]: (’a’, 1)
相关文章:
1. 为什么span的color非要内联样式才起作用?2. javascript - swiper.js嵌套了swiper 初始设置不能向下一个滑动 结束后重新初始3. angular.js - angular-ui-bootstrap 报错无法使用?4. docker - 如何修改运行中容器的配置5. python - 如何修改twisted自带的日志输出格式?6. 高并发写入和更新mysql7. 在cmd下进入mysql数据库,可以输入中文,但是查看表信息,不显示中文,是怎么回事,怎新手,请老师8. 请问一下各位老鸟 我一直在学习独孤九贱 现在是在tp5 今天发现 这个系列视频没有实战9. 老师,请问我打开browsersync出现这个问题怎么解决啊?10. 求救一下,用新版的phpstudy,数据库过段时间会消失是什么情况?

网公网安备