“大数据分析”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
 
第12行: 第12行:
 
*[[Python爬取静态网页]]
 
*[[Python爬取静态网页]]
 
*[[Python 爬虫 1 - Requests 库入门与实战]]
 
*[[Python 爬虫 1 - Requests 库入门与实战]]
 +
*[[Python 爬虫 2 - 信息提取(Beautiful Soup 库)]]
  
 
*[[Python爬取动态网页]]
 
*[[Python爬取动态网页]]

2018年8月27日 (一) 13:08的最新版本

网址收藏

网络爬虫入门

获取网页

解析网页

存储数据

存储数据的基础技术:存入txt文件和存入csv文件。存储数据的进阶技术:存入MySQL数据库和存入MongoDB数据库。

提升爬虫速度

其他

参考文档:

[1] https://github.com/Santostang/PythonScraping