“一带一路 大数据”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
技术资源
数据爬取
第26行: 第26行:
 
*微博爬取:[https://blog.csdn.net/qq_38316655/article/details/80671358 Python爬虫实列:新浪微博热门话题]
 
*微博爬取:[https://blog.csdn.net/qq_38316655/article/details/80671358 Python爬虫实列:新浪微博热门话题]
 
*BeuatifulSoup库的使用:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/
 
*BeuatifulSoup库的使用:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/
 +
*爬取豆瓣前9000条电影:https://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650726517&idx=1&sn=b7fd876df2f8515983b28bfcfeb1d9e7&chksm=bea691a689d118b051c1244380193c4e5755d9cd0f92d3a50baa2d96c05745e903fffc6f15a3&mpshare=1&scene=23&srcid=&sharer_sharetime=1566137513375&sharer_shareid=9a47d948e5a338ea483d560dfedff359#rd
 +
 
===后台引擎===
 
===后台引擎===
 
*[[一带一路__运维]]
 
*[[一带一路__运维]]

2019年9月20日 (五) 22:57的版本

进度

  • 电商淘宝数据 ?
  • 数据清洗 ?
  • 电影数据 ?
  • 一带一路 核心节点(网站)?
  • selenium 处理验证码:https://blog.csdn.net/Lionel_Qin/article/details/80969868
  • 首页新闻 :(随机、推荐)模式,向用户推荐个性化的一带一路新闻
  • Spark训练推荐


数据

  • 天猫国际馆:

技术资源

云服务器

数据爬取

后台引擎

数据可视化

人工智能

一带一路国家一览

东南亚

南亚

西亚北非

中东欧

中亚

独联体其他国