博客
关于我
Python爬取高清桌面壁纸(附源码),直接运行即可
阅读量:630 次
发布时间:2019-03-14

本文共 1719 字,大约阅读时间需要 5 分钟。

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

以下文章来源于云+社区,作者 深雾

转载地址

https://blog.csdn.net/fei347795790?t=1

直接运行即可,效果图:

 

代码如下

导入工具

import requests,osfrom pyquery import PyQuery as pqimport time

 

请求、解析网页数据,保存数据

headers = {    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 '                  '(KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}# 这里我使用了代理  你可以去掉这个代理IP 我是为了后面大规模爬取做准备的proxies = {    'https': '218.75.69.50:39590'} # 请求网页 获取源码def start_request(url):    r = requests.get(url, headers=headers, proxies=proxies)    # 这个网站页面使用的是GBK编码 这里进行编码转换    r.encoding = 'GBK'    html = r.text    return html # 解析网页 获取图片def parse(text,i):    doc = pq(text)    # 锁定页面中的img标签    images = doc('div.list ul li img').items()    x = 1    for image in images:        # 获取每一张图片的链接        img_url = image.attr('src')        # 获得每张图片的二进制内容        img = requests.get(img_url, headers=headers, proxies=proxies).content        # 定义要存储图片的路劲        # 创建目录        dir_path = os.path.dirname(os.path.abspath(__file__)) + "\\image\\"        imagspath = dir_path+'/imgs'+str(i)        # 创建目录        if not os.path.exists(imagspath):            os.makedirs(imagspath)         path = imagspath+"\\" + str(x) + ".jpg"        # 将图片写入指定的目录 写入文件用"wb"        with open(path, 'wb') as f:            f.write(img)            time.sleep(1)            print("正在下载第{}页{}张图片".format(i,x))            x += 1    print("写入完成") def main():    url = "http://www.netbian.com"    text = start_request(url)    parse(text,1)    #爬取指定范围页面    for i in range(2,100):        urlnum = url + "/index_"+str(i)+".htm"        textnum = start_request(urlnum)        parse(textnum,i) if __name__ == "__main__":    main()
你可能感兴趣的文章
Metasploit Web服务器渗透测试实战
查看>>
MFC模态对话框和非模态对话框
查看>>
Moment.js常见用法总结
查看>>
MongoDB出现Error parsing command line: unrecognised option ‘--fork‘ 的解决方法
查看>>
mxGraph改变图形大小重置overlay位置
查看>>
MongoDB可视化客户端管理工具之NoSQLbooster4mongo
查看>>
Mongodb学习总结(1)——常用NoSql数据库比较
查看>>
MongoDB学习笔记(8)--索引及优化索引
查看>>
mongodb定时备份数据库
查看>>
mppt算法详解-ChatGPT4o作答
查看>>
mpvue的使用(一)必要的开发环境
查看>>
MQ 重复消费如何解决?
查看>>
mqtt broker服务端
查看>>
MQTT 保留消息
查看>>
MQTT 持久会话与 Clean Session 详解
查看>>
MQTT工作笔记0007---剩余长度
查看>>
MQTT工作笔记0009---订阅主题和订阅确认
查看>>
Mqtt搭建代理服务器进行通信-浅析
查看>>
MS Edge浏览器“STATUS_INVALID_IMAGE_HASH“兼容性问题
查看>>
ms sql server 2008 sp2更新异常
查看>>