当前位置: 代码网 > it编程>前端脚本>Python > Python使用BeautifulSoup解析并获取图片的实战分享

Python使用BeautifulSoup解析并获取图片的实战分享

2024年06月12日 Python 我要评论
一、前言在本文我们将以下面的例子带着大家去看看在实战中是如何运用的。目标url:https://www.58pic.com/tupian/1272.html二、数据分析根据下图所示,图片被保存至img

一、前言

在本文我们将以下面的例子带着大家去看看在实战中是如何运用的。

目标url:https://www.58pic.com/tupian/1272.html

二、数据分析

根据下图所示,图片被保存至img标签下,并且class值为lazy。当然这个网站除了lazy的img标签还有其他的(比如:class="lazy-bg-img"),这个可以自己想办法处理一下,如何去获取所有跟图片有关的img标签。

三、数据获取及展示

数据获取

 '''
 爬虫:
 ​
 目标网站:https://www.58pic.com/c/27075257
 ​
 任务需求:1、抓取第一页前36张图片   2、使用bs4解析
 '''
 import time
 ​
 import requests
 from bs4 import beautifulsoup
 ​
 ​
 class image(object):
     def __init__(self):
         self.headers = {
             'user-agent':'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/116.0.0.0 safari/537.36 edg/116.0.1938.62'
         }
 ​
     def parse_url(self,url):
         print('开始分析')
         resp = requests.get(url,headers=self.headers)
         #print(resp.text)
         if resp.status_code == 200:
             soup = beautifulsoup(resp.text,'lxml')
             image_list = soup.find_all('img',class_='lazy-bg-img',limit=36)
             #print(image_list)
             for data in image_list:
                 title = data.get('alt')
                 # print(title)
                 print(f"开始下载 {title}")
                 img_url = 'https:'+data.get('data-original')
                 self.image_save(title,img_url)
         else:
             return none
 ​
     def image_save(self,title,url):
         resp = requests.get(url,headers=self.headers)
         content = resp.content
         with open('./img/'+title+'.jpg',mode='wb')as f:
             f.write(content)
 ​
 if __name__ == '__main__':
     t = time.time()
     url='https://www.58pic.com/tupian/1272.html'
     image = image()
     image.parse_url(url)
     print("总共耗时:",time.time()-t)

最终效果展示

四、结语

根据示例,我们会发现通过bs4解析可以很快速的根据标签的特殊性得到我们想要的数据。但要注意,有时候我们得到的响应内容会与f12打开看到的不同,所有在发现没有拿到数据的时候,请考虑我们得到的相应内容里面究竟是什么样子的。

到此这篇关于python使用beautifulsoup解析并获取图片的实战分享的文章就介绍到这了,更多相关python beautifulsoup获取图片内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com