Python从URL中提取域名
问题描述
Python如何从URL中提取域名?url有各种格式的如下:
输入:
https://docs.google.com/spreadsheet/ccc?key=blah-blah-blah-blah#gid=1https://stackoverflow.com/questions/1234567/blah-blah-blah-blahhttp://www.domain.comhttps://www.other-domain.com/whatever/blah/blah/?v1=0&v2=blah+blah ...
输出:
docs.google.comstackoverflow.comwww.domain.comwww.other-domain.com
问题解答
回答1:使用Python 内置的模块 urlparse
from urlparse import *url = ’https://docs.google.com/spreadsheet/ccc?key=blah-blah-blah-blah#gid=1’result = urlparse(url)
result 包含了URL的所有信息
回答2:原文出处:Python实用脚本清单
从URL中提取域名
def extractDomainFromURL(url): '''Get domain name from url''' from urlparse import urlparse parsed_uri = urlparse(url) domain = ’{uri.netloc}’.format(uri=parsed_uri) return domain
相关文章:
1. nignx - docker内nginx 80端口被占用2. docker绑定了nginx端口 外部访问不到3. docker网络端口映射,没有方便点的操作方法么?4. javascript - canvas 裁剪空白区域5. docker不显示端口映射呢?6. angular.js - angular内容过长展开收起效果7. docker - 各位电脑上有多少个容器啊?容器一多,自己都搞混了,咋办呢?8. javascript - nodejs调用qiniu的第三方资源抓取,返回401 bad token,为什么9. dockerfile - 我用docker build的时候出现下边问题 麻烦帮我看一下10. debian - docker依赖的aufs-tools源码哪里可以找到啊?
