Python获取网页上图片下载地址的方法
本文实例讲述了Python获取网页上图片下载地址的方法。分享给大家供大家参考。具体如下:
这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下:
#!/user/bin/python3
import urllib2
from HTMLParser import HTMLParser
class MyHtmlParser(HTMLParser):
links = []
def handle_starttag(self, tag, attrs):
if tag == "img":
if len(attrs) == 0:
pass
else:
for name, value in attrs:
if name == "src":
self.links.append(value)
if __name__ == "__main__":
uri = "http://dy.163.com/v2/article/T1374483113516/AGSNE9L000964K4O"
file = urllib2.urlopen(uri).read()
# file = "<html><h1>Title</h1><p>I'm a paragraph!</p></html>"
hy = MyHtmlParser()
hy.feed(file)
hy.close()
print(hy.links)
希望本文所述对大家的Python程序设计有所帮助。
相关推荐
-
Python3实现Web网页图片下载
先来介绍一些python web编程基础知识 1. GET与POST区别 1)POST是被设计用来向web服务器上放东西的,而GET是被设计用来从服务器取东西的,GET也能够向服务器传送较少的数据,而Get之所以也能传送数据,只是用来设计告诉服务器,你到底需要什么样的数据.POST的信息作为HTTP 请求的内容,而GET是在HTTP 头部传输的: 2)POST与GET在HTTP 中传送的方式不同,GET的参数是在HTTP 的头部传送的,而Post的数据则是在HTTP 请求的内容里传送; 3)PO
-
python在多玩图片上下载妹子图的实现代码
复制代码 代码如下: # -*- coding:utf-8 -*-import httplibimport urllibimport stringimport redef getContent(): #从网站中获取所有内容 conn = httplib.HTTPConnection("tu.duowan.com") conn.request("GET", "/m/meinv/index.html") r = c
-
Python下载指定页面上图片的方法
本文实例讲述了Python下载指定页面上图片的方法.分享给大家供大家参考,具体如下: #!/usr/bin/python #coding:utf8 import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.*?\.jpg)" ' imgre = re.compile(reg) im
-
python实现爬虫下载美女图片
本次爬取的贴吧是百度的美女吧,给广大男同胞们一些激励 在爬取之前需要在浏览器先登录百度贴吧的帐号,各位也可以在代码中使用post提交或者加入cookie 爬行地址:http://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3&ie=utf-8&pn=0 #-*- coding:utf-8 -*- import urllib2 import re import requests from lxml import etree 这些是要导入的库,代码并没有使用正则
-
Python实现豆瓣图片下载的方法
本文实例讲述了Python实现豆瓣图片下载的方法.分享给大家供大家参考.具体分析如下: 1 用 tk 封装一下 2 用户可以自己输入图片url download_douban_album # -*-coding:UTF-8 -*- import re import urllib def count_percent(a, b, c): per = 100.0 * a * b / c if per > 100: per = 100 print '%.2f%%' % per def get_url()
-
python批量下载图片的三种方法
有三种方法,一是用微软提供的扩展库win32com来操作IE,二是用selenium的webdriver,三是用python自带的HTMLParser解析.win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到).selenium则提供了Chrome,IE,FireFox等的支持,每种浏览器都有execute_script和find_element_by_xx方法,可以方便的执行js脚本(包括修改元素)和读取html里面的元素.不足是selenium只提供对py
-
使用Python下载Bing图片(代码)
直接上代码: 复制代码 代码如下: <span style="font-family: arial,helvetica,sans-serif; font-size: 16px;"># -*- coding: cp936 -*-import urllibimport os print 'Download data......'url = 'http://cn.bing.com'urlFile = urllib.urlopen(url)data = urlFile.read()
-
Python实现从订阅源下载图片的方法
本文实例讲述了Python实现从订阅源下载图片的方法.分享给大家供大家参考.具体如下: 这段代码是基于python 3.4实现的,和python2.X 比起来有了好多差别啊. 这是一个练习,数据源来自网易订阅.代码如下: 复制代码 代码如下: __author__ = 'Saint' import os import urllib.request import json from html.parser import HTMLParser # 从获取的网页内容筛选图片的内容 class MyHt
-
python实现下载指定网址所有图片的方法
本文实例讲述了python实现下载指定网址所有图片的方法.分享给大家供大家参考.具体实现方法如下: #coding=utf-8 #download pictures of the url #useage: python downpicture.py www.baidu.com import os import sys from html.parser import HTMLParser from urllib.request import urlopen from urllib.parse im
-
Python实现批量下载图片的方法
本文实例讲述了Python实现批量下载图片的方法.分享给大家供大家参考.具体实现方法如下: #!/usr/bin/env python #-*-coding:utf-8-*-' #Filename:download_file.py import os,sys import re import urllib import urllib2 base_url = 'xxx' array_url = list() pic_url = list() inner_url = list() def get_a
随机推荐
- ajax代理程序,自动判断字符编码
- Flex中在Tree绑定数据后自动展开树节点的方法
- mysql root用户的密码修改和消除
- js的hasownproperty使用示例
- Mac 下阿里云服务器的配置方法
- spring中bean id相同引发故障的分析与解决
- CreateOutputCachedItemKey 缓存key的创建
- C#反射实例学习及注意内容
- 非常重要的php正则表达式详解
- ASP存储过程开发应用详解第1/2页
- C语言菜鸟基础教程之条件判断
- JS的参数传递示例介绍
- 趣谈Unicode、Ascii、utf-8、GB2312、GBK等编码知识
- Ajax 框架学习笔记
- 将Java的List结构通过GSON库转换为JSON的方法示例
- 如何用C语言画一个“圣诞树”
- javascript 利用Image对象实现的埋点(某处的点击数)统计
- Android开发实现的内存管理工具类
- 深入了解js原型模式
- python标记语句块使用方法总结
