我的第一个网络爬虫

来自CloudWiki
跳转至: 导航搜索

源代码

import urllib.request
#导入urllib.request

f = urllib.request.urlopen('http://www.baidu.com/')
#打开网址,返回一个类文件对象

print(f.read(500))
#打印前500字符
print("utf-8编码:")
print(f.read(500).decode('utf-8'))