python爬取图床壁纸
python,爬取,图床,壁纸
2025-03-20 08:49:01 时间
# coding=utf-8
"""
作者:gaojs
功能:
新增功能:
日期:2022/5/13 20:14
"""
import os.path
import json
import pprint
import re
import requests
from faker import Factory
def get_random_ua():
"""
获取随机UA
"""
fact = Factory.create()
ua = fact.user_agent()
return ua
def get_photo():
"""
爬取华灯上博客的图床信息
"""
if not os.path.exists('photo/'):
os.mkdir('photo/')
random_ua = get_random_ua()
# url = 'https://mengkai.fun:88/album/C7X'
# 翻页操作
for page in range(1, 10):
url = f'https://mengkai.fun:88/album/C7X/?sort=date_desc&page={page}'
headers = {
'user-agent': random_ua
}
rsp = requests.get(url=url, headers=headers, timeout=50)
# print(rsp.text)
# 获取图片标题
photo_name = re.findall('<a href=".*?" class="list-item-desc-title-link" data-text="image-title" data-content="image-link">(.*?)</a>', rsp.text)
photo_list = list(photo_name)
for photo in photo_list:
photo_title = photo
# print(photo_title)
# 获取图片url
url_title = re.findall('<img src="(.*?)" alt="(.*?)" width="500" height="281">', rsp.text)
list_url_title = list(url_title)
# print(list_url_title)
for index in list_url_title:
new_url = index[0]
url_rfind = new_url[:new_url.rfind('/')]
end_url = index[1]
new_url_content = url_rfind + '/' + end_url
print(new_url_content)
# print(new_url)
# 下载图床图片到本地
content_photo = requests.get(new_url_content, headers=headers, timeout=50).content
with open('photo/' + end_url, mode='wb') as f:
print(f'******************************正在下载 {end_url} ****************************')
f.write(content_photo)
def get_page():
"""
翻页操作
"""
pass
get_photo()
相关文章
- python json.loads()、json.dumps()和json.dump()、json.load()区别
- Python笔记 第三章
- Python面试基础知识_python自学需要哪些基础知识
- Python进阶39-drf框架(一)
- 整理了上千个Python类库,简直太酷啦!
- python数据分析源码_python 统计分析
- OpenCV进行人脸识别(Python)
- Python项目49-用户验证短信接口(可劲撸)
- 超强 Python 数据可视化库,一文全解析
- Python项目44-前后端分离项目(前戏)
- 用python给女朋友表白_python绘制太阳花
- pyqt ui设计_python pyqt5界面开发
- Python基础12-内置函数
- Python 模板渲染库 yaml 和 jinja2 的实战经验分享
- python怎么把字体调大_python修改字体
- Python嵌套函数与匿名函数
- 2022年最新Python大数据之Python基础【九】面向对象与继承
- Python-drf前戏38.2-前端Vue02
- Python继续霸榜,SQL写得溜,面试或许能加分
- 在树莓派中使用 MicroPython 接入 MQTT