您现在的位置是：首页 > Python

当前栏目

Python批量采集云南携程酒店信息

Python,批量,采集,云南,携程,酒店,信息

2025-03-25 08:59:25 时间

昨天收到一个订单需求需要爬取携程云南酒店的名称，价格，评分，点评数，道路特点和地址信息1000条用来做酒店数据分析的工作，虽然1000条数据量不是很大，但是复制粘贴也需要花费很长的时间而且数据也不好整理，所以我们今天使用python来完成这件事情。开发工具我们还是选择pycharm和谷歌浏览器，python我用的是3.6版本。本次数据采集总共有四个步骤：1.分析目标网址；2.获取网站响应内容；3.解析网站响应内容；4.保存响应内容。目前大部分都会将数据保存至csv文件中，因为csv文件以逗号分开，可以在wps中直接转为excel文件，比较方便。当然我们也可以根据不同的需求保存到不同的文件类型。接下来我们将按照步骤依次来完成爬虫工作：

1.分析目标网址

打开谷歌浏览器，进入携程酒店网，城市选择大理，下拉酒店发现网址并没有发生变化，说明这些数据是动态加载的。右击鼠标打开检查，下拉页面搜索搜索更多酒店，会发现出现两个包，其中下面那个包就是酒店信息的包，我们会发现请求为POST，这样就顺利就抓到酒店信息的包了。我们打开headers发现请求地址，请求方式，请求状态码，请求头信息，cookie信息，refer信息都在，往下翻还有Requst playroad，打开searchCondition，发现入住日期，离开日期，入住人数，城市，页数，酒店数量都在这个字典中，后期我们只需要更换页码就可以拿到更多页的酒店信息，更换日期就可以拿到不同时间段的酒店信息，更换城市姓名和城市id就可以拿到更多城市的信息。

2.获取响应内容

导入相关库

构造请求头

构造POST响应体

发送POST请求

3.解析响应内容

4.保存响应内容

至此，便完成了大理携程酒店的1000条数据，总共用时10分钟，是不是很赞，大家需要源码可以后台私聊我。需要爬取多页只需要加上for循环遍历页数就可以啦。

本文仅供参考。

猜你喜欢

Python-drf前戏38.1-前端Vue01
python+pycharm+pyqt5安装教程「建议收藏」
二级Python选择题_二级python选择题题库
在树莓派中使用 MicroPython 接入 MQTT
python pip手动安装二进制包
python pip源更换国内镜像,速度加快10倍
快速入门Python机器学习（24）
Python进阶42-drf框架(四)
python爬虫的4个实例
Python-drf前戏38.3-前端Vue03
快速入门Python机器学习（32）
Python-基础01-变量
Python-drf前戏38-前端Vue
在 Pandas DataFrame 中应用 IF 条件的5种方法
pycharm安装教程2020.3.4_python安装步骤
【过程记录】python环境离线迁移
Python进阶26-Django 视图层
最强最炫的Python数据可视化神器，没有之一！
Pycharm最简单安装Python里面的各种包
pycharm html注释快捷键_python一键注释

Python程序教程

当前栏目

Python批量采集云南携程酒店信息

相关文章