Hive的启动
来自CloudWiki
Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,存储、查询和分析存储在 Hadoop 中的大规模数据。 Hive 定义了一种类 SQL 语言 HQL ,通过简单的 HQL 语言将数据操作转换为复杂的 MapReduce 运行在 Hadoop 大数据平台上。
Hive 是一款分析历史数据的利 器。但是 Hive 只有在结构化数据的情况下才能大显神威。 Hive 处理有延迟性, Hive 的最佳使用场合是大数据集的批处理作业,例如,网络日志分析。
实训环境
(1) 使用 CentOS 6.10 的 Linux 操作系统搭建的 3 个节点的 Hadoop 集群。
(2) 使用 1.8 的 JDK 。
(3) 使用 2.6.4 版本的 Hadoop 。
(4) 使用 1.2.1 版本的 Hive 。
实训前置步骤
(1) 在 Linux 终端执行命令“ initnetwork ”,或双击桌面上名称为“初始化网络”的图标,初始化实训平台网络。
(2) 在 Linux 终端执行命令“ $HADOOP_HOME/sbin/start-all.sh ”,或双击桌面上名称为“ hadoop ”的图标,启动 hadoop 集群。
(3) 在 Linux 终端执行命令“ service mysqld start ”,启动 Mysql 服务。
(4) 确保 hadoop 集群启动成功后,在 Linux 终端执行命令“ hive ”,启动 Hive ,如果未能成功启动则输入指令“ hive --service metastore & ”再执行命令“ hive ”。
[root@master ~]# hive
Logging initialized using configuration in jar:file:/usr/local/apache-hive-1.2.1-bin/lib/hive-common-1.2.1.jar!/hive-log4j.properties hive>