HUE简介 HUE=Hadoop User Experience(Hadoop用户体验),直白来说就一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用HUE我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。
官网网站:http://gethue.com/
HUE安装 文档:http://archive.cloudera.com/cdh5/cdh/5/hue-3.9.0-cdh5.16.1/
软件环境 apache-maven-3.3.9-bin.tar.gz
apache-ant-1.8.1-bin.tar.gz
安装Maven和Ant 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 # 解压 maven 和 ant tar -zxvf /media/psf/centos_share/apache-maven-3.3.9-bin.tar.gz tar -zxvf /media/psf/centos_share/apache-ant-1.8.1-bin.tar.gz # 配置环境变量 export MAVEN_HOME=/home/machine/apps/maven-3.3.9 export PATH=$MAVEN_HOME/bin:$PATH export ANT_HOME=/home/machine/apps/ant-1.8.1 export PATH=$ANT_HOME/bin:$PATH # 加载配置文件 source ~/.bash_profile # 最后检查安装执行 mvn -version ant -v
安装HUE所需要的依赖包 1 2 3 4 5 6 7 yum install asciidoc cyrus-sasl-devel cyrus-sasl-gssapi cyrus-sasl-plain gcc gcc-c++ krb5-devel libffi-devel libtidy libxml2-devel libxslt-devel make mysql mysql-devel openldap-devel python-devel sqlite-devel openssl-devel gmp-devel -y 安装mysql-devel出现冲突,可能和我之前安装mysql的过程有关系,于是按照提示卸载了如下 sudo yum -y remove mysql-community-common-5.7.27-1.el7.x86_64 sudo yum -y remove mysql-community-libs-5.7.27-1.el7.x86_64 然后重新执行以上依赖安装,成功了
解压安装Hue的tar包,编译 1 2 3 tar -xvf /media/psf/centos_share/hue-3.9.0-cdh5.16.1.tar.gz cd hue-3.9.0-cdh5.16.1 make apps
修改编写配置Hue.ini文件 1 2 3 4 5 # key是官网给的 secret_key=jFE93j;2[290-eiw.KEiwN2s3['d;/.q[eIW^y#e=+Iei*@Mn<qW5o # 21行 http_host=mxxcentos7 # 28行 http_port=8888 # 29行 time_zone=Asia/Shanghai # 45行
启动 1 2 3 4 5 6 7 ./build/env/bin/supervisor # http://mxxcentos7:8888/ # http://mxxcentos7:8888/about/ 整合页面报错,因为还没有集成其他框架 账号:hadoop 123456
关于
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 hue安装好了,但是Mysql挂了,因为刚刚解决冲突的时候卸载了... 我在docker里安了一个mysql... 信息如下: mxxcentos7 3306 root 123456 docker安装mysql https://www.runoob.com/docker/docker-install-mysql.html # 运行容器 root 123456 docker run -itd --name mysql-test -p 3306:3306 -e MYSQL_ROOT_PASSWORD=123456 mysql docker查看所有容器(包括不运行的) docker ps -a # 停止容器 docker stop mysql-test # 开启容器 docker start mysql-test (上次的数据还在的) # 删除容器 docker rm mysql-test (彻底没了)
HUE与其他框架的集成 HUE与Mysql 配置hue.ini
1 2 3 4 5 6 7 [[[mysql]]] nice_name=db_mysql engine=mysql host=mxxcentos7 port=3306 user=root password=123456
重启hue测试
1 2 3 4 5 6 7 8 9 10 11 # 启动后即可测试是否成功连接Mysql服务,并且测试是否可以看到数据 ./build/env/bin/supervisor 还是遇到老问题:libmysqlclient.so.18 Error loading MySQLdb module: libmysqlclient.so.18: cannot open shared object file: No such file or directory 参考我的blog【CM的安装】测试hue报错解决办法 cp /media/psf/dongzhi/Linux_Pack/mysql5.7/mysql_lib/* /usr/lib64/ # 再试。就可以查到mysql数据了 http://mxxcentos7:8888/hue/editor/?type=mysql
所以hue就是个可视化的集成管理工具。
HUE与HDFS 配置HDFS hdfs-site.xml
1 2 3 4 5 <property > <name > dfs.webhdfs.enabled</name > <value > true</value > </property >
core-site.xml
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 <property > <name > hadoop.proxyuser.machine.hosts</name > <value > *</value > </property > <property > <name > hadoop.proxyuser.machine.groups</name > <value > *</value > </property > <property > <name > hadoop.proxyuser.hue.hosts</name > <value > *</value > </property > <property > <name > hadoop.proxyuser.hue.groups</name > <value > *</value > </property > <property > <name > hadoop.proxyuser.httpfs.hosts</name > <value > *</value > </property > <property > <name > hadoop.proxyuser.httpfs.groups</name > <value > *</value > </property >
httpfs-site.xml
1 2 3 4 5 6 7 8 9 <property > <name > httpfs.proxyuser.hue.hosts</name > <value > *</value > </property > <property > <name > httpfs.proxyuser.hue.groups</name > <value > *</value > </property >
启动httpfs服务 1 2 3 4 # 先启动hdfs start-dfs.sh # http要使用该协议访问HDFS(在namenide节点启动,不需要在所有hadoop集群) httpfs.sh start
配置hue.ini文件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 [[hdfs_clusters]] [[[default]]] fs_defaultfs=hdfs://mxxcentos7:9000 webhdfs_url=http://mxxcentos7:14000/webhdfs/v1 hadoop_conf_dir=/home/machine/apps/hadoop-2.6.0-cdh5.16.1/etc/hadoop hadoop_hdfs_home=/home/machine/apps/hadoop-2.6.0-cdh5.16.1 hadoop_bin=/home/machine/apps/hadoop-2.6.0-cdh5.16.1/bin
测试 1 2 3 build/env/bin/supervisor # 然后也可以对HDFS进行界面操作了
HUE与YARN 配置hue.ini
1 2 3 4 5 6 7 8 9 10 11 12 13 [[yarn_clusters]] [[[default]]] resourcemanager_host=mxxcentos7 resourcemanager_port=8032 submit_to=True resourcemanager_api_url=http://mxxcentos7:8088 proxy_api_url=http://mxxcentos7:8088 history_server_api_url=http://mxxcentos7:19888
测试
1 2 3 4 5 build/env/bin/supervisor http://mxxcentos7:8888/hue/jobbrowser/#!jobs # 测一下 yarn jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.16.1.jar wordcount /wordcount.txt /output_1115
HUE与Hive TODO
HUE与Zookeeper TODO
HUE与HBase TODO
HUE与Oozie TODO