“大数据分析”的版本间的差异

2018年8月27日 (一) 13:08的最新版本

存储数据的基础技术：存入txt文件和存入csv文件。存储数据的进阶技术：存入MySQL数据库和存入MongoDB数据库。

参考文档：

@@ 第1行： / 第1行： @@
 *[[Hadoop平台安装部署]]
 ==网址收藏==
-*[https://mp.weixin.qq.com/s?__biz=MzU4OTYwMTQ2MQ==&mid=2247483919&idx=1&sn=bc1cc24d79f3dc8d969a518a6e7b0dc5&chksm=fdca4dd5cabdc4c31089cf6e70e9a4f5c7ab244d6beaf16d1d513b68be4706eb3fec97b42169&mpshare=1&scene=23&srcid=0704UnjWRmksE0Q0YcZ4XRqw#rd Python实战 | 只需 “4步” 入门网络爬虫]
+*[[大数据网站收藏]]
-*[https://mp.weixin.qq.com/s?__biz=MzA4MjEyNTA5Mw==&mid=2652567982&idx=1&sn=4ba2c74b0941b3f3a93498245a9217ff&chksm=8464d1e4b31358f2181a0eed7878a76d79ca9481f5b70b61f7288c6ad8eb405d531ababad01f&mpshare=1&scene=23&srcid=0719Day8QXQch58ZSCmLafUV#rd 使用 Python 分析《我不是药神》豆瓣电影短评]
 ==网络爬虫入门==
@@ 第12行： / 第11行： @@
 *[[Python爬取静态网页]]
+*[[Python 爬虫 1 - Requests 库入门与实战]]
+*[[Python 爬虫 2 - 信息提取(Beautiful Soup 库)]]
 *[[Python爬取动态网页]]
 ==解析网页==
 *[[Python解析网页]]
-解析网页的基础技术：re正则表达式、BeautifulSoup和lxml。
-解析网页的进阶技术：解决中文乱码。
 ==存储数据==
@@ 第33行： / 第31行： @@
 ==其他==
 *[[数据获取]]
+*[[通过API获取数据]]
+*[[搭建 PySpider 爬虫服务]]
 *[[数据清洗和整理]]
 *[[数据计算和表达]]