大数据系统整体架构

来自CloudWiki
跳转至: 导航搜索

该学情分析案例数据库采用MySQL数据库,使用Java Web SSH开发框架(Spring+Struts+Hibernate)技术,采用Tomcat服务器作为部署环境。

在数据挖掘过程,采用了WebMagic网络爬虫来进行数据采集、MapReduce计算框架来进行数据清洗、Mahout来进行数据分析。

最后数据可视化层使用了D3.js和Echarts模板来进行前端页面开发。

Hadoop平台使用的是Ambari平台,存储服务使用了Hive和Hdfs。

学情分析系统架构图如图1-12所示。

文件:Big1-3.png

参考文档:《Hadoop大数据构建与应用》