帮助中心

   

热门搜索: 免费续期  推广  永久会员

代理IP教你爬虫如何进行URL编码与解码

Python语言因为其便捷性以及功能的强大,吸引了越来越多人使用与学习。在互联网日新月异的现在,编程似乎变得非常吃香,懂得编程语言能够在这个大数据时代更好地开展网络项目,像是爬虫等。特别是代理IP的使用,让爬虫没有以前那么复杂,只需要选好你的代理服务商,你只需要专注于你的代码跟设置即可。

 

 

当我们进行Python爬虫的时候,经常要涉及到URL的编码和解码工作,因此制作了一个类,代码如下:

 

# coding:utf-8

import urllib.parse

class Urlchuli():

“””Url处理类,要传入两个实参:Urlchuli(‘实参’,’编码类型’),默认utf-8

url编码方法:url_bm() url解码方法:url_jm()”””

def __init__(self,can,mazhi=’utf-8′):

self.can = can

self.mazhi = mazhi

def url_bm(self):

“””url_bm() 将传入的中文实参转为Urlencode编码”””

quma = str(self.can).encode(self.mazhi)

bianma = urllib.parse.quote(quma)

return bianma

def url_jm(self):

“””url_jm() 将传入的url进行解码成中文”””

quma = str(self.can)

jiema = urllib.parse.unquote(quma,self.mazhi)

return jiema

url编码调用方法:

# coding:utf-8

from urlbm import Urlchuli

a = Urlchuli(‘测试是否成功’,’gbk’) # 第一个是传入的实参,第二个是选填url编码的类型(默认utf-8),可以是utf-8、gbk或其他

print(a.url_bm()) # 打印结果:%B2%E2%CA%D4%CA%C7%B7%F1%B3%C9%B9%A6

URL解码调用方法:

# coding:utf-8

from urlbm import Urlchuli

a = Urlchuli(‘%B2%E2%CA%D4%CA%C7%B7%F1%B3%C9%B9%A6′,’gbk’) # 第一个是传入的实参,第二个是需要url解码的类型,可以是utf-8、gbk或其他

print(a.url_jm()) # 打印结果:测试是否成功(这里需要注意,如果是utf-8会出现乱码)

 

迅联加速拥有多年动态拨号服务器运营经验,自有资源搭建动态IP服务器,轻松上手!

关闭
19907977089
关注微信公众号,免费送30分钟时长