Python 爬虫 NO.2 HTTP 和 HTTPS
Python,爬虫,NO.2,HTTP,HTTPS
2025-03-25 08:59:27 时间
1. HTTP 和 HTTPS
1.1 HTTP
HTTP 的全称是 Hyper Text Transfer Protocol,中文名叫作超文本传输协议。HTTP 协议是用于从网络传输超文本数据到本地浏览器的传送协议,它能保证高效而准确地传送超文本文档。
1.2 HTTPS
HTTPS 的全称是 Hyper Text Transfer Protocol over Secure Socket Layer,是以安全为目标的 HTTP 通道,简单讲是 HTTP 的安全版,即在 HTTP 下加入 SSL 层,简称为 HTTPS。
2. SSL 加密的主要作用
- 建立一个信息安全通道,保证数据传输的安全性。
- 确认网站的真实性。凡是使用了 https 的网站,都可以通过点击浏览器地址栏的锁头标志来查看网站认证之后的真实信息,也可以通过 CA 机构颁发的安全签章来查询。
注意:HTTP 和 HTTPS 协议都属于计算机网络中的应用层协议,其下层是基于 TCP 协议实现的,TCP 协议属于计算机网络中的传输层协议,包括建立连接时的三次握手和断开时的四次挥手等过程。但本书主要讲的是网络爬虫相关,主要爬取的是 HTTP/HTTPS 协议相关的内容,所以这里就不再展开深入讲解 TCP、IP 等相关知识了,感兴趣的读者可以搜索相关资料了解下,如《计算机网络》、《图解 HTTP》等书籍。
相关文章
- Python爬虫之BeautifulSoup
- Python招聘岗位信息聚合系统源码(爬虫爬取、数据分析、可视化、互动等功能)
- Python 有道翻译爬虫,破解 sign 参数加密反爬机制,解决{"errorCode":50}错误
- [Python 爬虫]煎蛋网 OOXX 妹子图爬虫(1)——解密图片地址
- 【Python】 "爬虫"出发前的装备之一正则表达式
- Python爬虫之验证码识别
- Python爬虫之urllib
- Python爬虫之fiddler手机抓包
- Python爬虫之scrapy框架
- Python 爬虫 NO.4 HTTP 响应状态码
- Python爬虫之数据写入
- python爬虫的4个实例
- python爬虫基础源代码
- mac pycharm安装设置_python爬虫 | mac系统PyCharm的安装「建议收藏」
- Python爬虫之xpath语法及案例使用
- Python爬虫(全)
- python和pythoncharm有什么区别_python为什么叫爬虫
- Python实现 —【简易】12306爬虫[通俗易懂]
- Python爬虫之多线程
- Python爬虫之requests