“大数据开发路线图”的版本间的差异
来自CloudWiki
(未显示同一用户的1个中间版本) | |||
第3行: | 第3行: | ||
==数据爬取== | ==数据爬取== | ||
+ | 资料来源:DC学院_Python爬虫入门进阶 | ||
+ | |||
*Python爬虫入门 | *Python爬虫入门 | ||
*Python爬虫之Scrapy框架 | *Python爬虫之Scrapy框架 | ||
第9行: | 第11行: | ||
==数据分析== | ==数据分析== | ||
+ | 资料来源:DC学院_数据分析书(中级) | ||
*用Numpy进行科学计算 | *用Numpy进行科学计算 | ||
*用Pandas分析多维数据 | *用Pandas分析多维数据 | ||
第21行: | 第24行: | ||
*开发环境搭建 | *开发环境搭建 | ||
*Hadoop生态系统 | *Hadoop生态系统 | ||
− | *Spark | + | *Spark 计算平台 |
+ | *实战:用Spark搭建一个推荐系统 | ||
==网站部署== | ==网站部署== | ||
第31行: | 第35行: | ||
*Django模板,中间件,日志,ORM使用 | *Django模板,中间件,日志,ORM使用 | ||
*蓝鲸API调用 | *蓝鲸API调用 | ||
+ | |||
+ | 视频学习地址:https://ke.qq.com/course/452904 | ||
+ | |||
+ | 实操作业地址:https://docs.qq.com/sheet/DVGpZZ2ZiRVJHYWlp | ||
+ | |||
+ | 活动打卡地址:https://bk.tencent.com/s-mart/community/question/893 | ||
+ | |||
==参考资料== | ==参考资料== | ||
*https://coding.imooc.com/class/431.html | *https://coding.imooc.com/class/431.html |
2020年4月15日 (三) 10:29的最新版本
Python基础
- 中国大学Mooc
数据爬取
资料来源:DC学院_Python爬虫入门进阶
- Python爬虫入门
- Python爬虫之Scrapy框架
- Python爬虫进阶操作
- 分布式爬虫及实训项目
数据分析
资料来源:DC学院_数据分析书(中级)
- 用Numpy进行科学计算
- 用Pandas分析多维数据
- 用数据可视化进行探索性分析
- 数据挖掘方法
- 时间序列分析
- 网络数据分析
大数据平台
学习资料来源:高寻真源,DC学院
- 开发环境搭建
- Hadoop生态系统
- Spark 计算平台
- 实战:用Spark搭建一个推荐系统
网站部署
学习资料来源:腾讯蓝鲸选秀课
- 蓝鲸PaaS解决方案
- Python基础及Html,CSS,JS基础
- Django 入门级使用
- Django模板,中间件,日志,ORM使用
- 蓝鲸API调用
视频学习地址:https://ke.qq.com/course/452904
实操作业地址:https://docs.qq.com/sheet/DVGpZZ2ZiRVJHYWlp
活动打卡地址:https://bk.tencent.com/s-mart/community/question/893