基于python爬取有道翻译过程图解
1.准备工作
先来到有道在线翻译的界面http://fanyi.youdao.com/
F12 审查元素 ->选Network一栏,然后F5刷新 (如果看不到Method一栏,右键Name栏,选中Method)
输入文字自动翻译后发现Method一栏有GET还有POST;GET是指从服务器请求和获得数据,POST是向指定服务器提交被处理的数据、
随便打开一个POST,找到preview可以看到我们输入的“我爱你一生一世”数据,可以证明post的提交数据的
下面分析一下Headers各个字段的意义;User-agent字段很重要
下面来看一下request模块中urlopen方法,查看文档;
发现urlopen有一个data参数,如果参数没赋值(默认None)就是GET形式,如果data参数被赋值了,就以POST形式提交
在这里,data参数其实是一个字典 ;就是源代码中From Data的数据
下面一篇文章是对urlencode与unquote的详细解释:(urllib库里可惜没有urldecode函数)
https://www.jb51.net/article/183857.htm
为什么要进行编码和解码呢?------》对于一些中文或者字符,url是不识别的,需要进行编码转换!encode(’utf-8’)把unicode的形式变成utf-8decode(’utf-8’)把utf-8形式变成Unicode编码形式2.下面进行敲!
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持好吧啦网。
相关文章:
1. 使用EF Code First搭建简易ASP.NET MVC网站并允许数据库迁移2. ThinkPHP6使用JWT+中间件实现Token验证实例详解3. Python 用NumPy创建二维数组的案例4. 三个不常见的 HTML5 实用新特性简介5. intellij idea写Python教程6. 利用VS2019创建Web项目并发送到IIS及IIS与ASP.NET配置教程7. 使用HttpClient消费ASP.NET Web API服务案例8. 怎样才能用js生成xmldom对象,并且在firefox中也实现xml数据岛?9. ASP中if语句、select 、while循环的使用方法10. jsp filter 过滤器功能与简单用法示例
