在Ambari 2.7.4集群中部署DataSphere Studio
DataSphere Studio(简称DSS)是微众银行自研的一站式数据应用开发管理门户。
基于插拔式的集成框架设计,及计算中间件 Linkis ,可轻松接入上层各种数据应用系统,让数据开发变得简洁又易用。
在统一的UI下,DataSphere Studio以工作流式的图形化拖拽开发体验,将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出应用等,数据应用开发全流程场景需求。
DSS通过插拔式的集成框架设计,让用户可以根据需要,简单快速替换DSS已集成的各种功能组件,或新增功能组件。
借助于 Linkis 计算中间件的连接、复用与简化能力,DSS天生便具备了金融级高并发、高可用、多租户隔离和资源管控等执行与调度能力。
但是,官方的安装文档略简单,一些配置细节为了简化安装没有介绍。导致安装阻拦了部分不同环境用户。为此,本人将我的安装过程整理出来,供大家参考。
1 概述
2 基于Ambari集群配置独立client机
2.1 大数据集群环境
2.2 DataSphere Studio专用client机配置
2.2.1 基础配置说明
2.2.2 hosts和hostname
2.2.3 配置主机到client的免密码登录
2.3 Ambari集群中增加DataSphere Studio专用Client
2.3.1 指定主机
2.3.2 确认要登记的主机
2.3.3 指定在client上安装的组件
2.3.4 指定配置组
2.3.5 审查配置
2.3.6 安装、启动、测试
2.3.7 完成
2.4 客户机上安装的组件位置及配置文件位置
3 安装DataSphere Studio
3.1 安装包
3.2 依赖项安装
3.3 Yum安装nginx
3.4 撤销cp/mv/rm别名
3.5 修改配置
3.5.1 配置文件示例
3.6 修改数据库配置
3.6.1 创建数据库
3.6.2 配置
3.7 执行安装脚本
3.7.1 安装步骤
3.7.2 验证安装是否成功
3.8 访问地址
3.9 FAQ
4 启动服务
4.1 启动服务
4.2 查看是否启动成功
5 坑
5.1 提交上传资源任务失败
5.2 有的服务显示已经在运行
5.3 启动linkis失败
5.4 上传资源失败
5.4.1 hdfs中tmp/linkis的owner是root:hdfs
6 附录
已经基于Ambari 2.7.4部署了四节点的大数据集群。各节点上安装的组件由ambari自动配置,没有手动配置。
在dn1节点上安装了mysql5.7社区版,大数据组件的元数据均存储在dn1节点的mysql数据库内。
四个节点如下:
centos7最小化安装
自带python2.7
卸载原有openJDK,换为oracle jdk 1.8
#yum -y install wget
16G内存,4核心
加入
IP地址 节点的FQDN域名
例如:
192.168.94.132 datastudio.sinobd
加入节点的FQDN名称
例如
重启生效
#ssh-copy-id -i ~/.ssh/id_rsa.pub 客户机IP地址或机器名
2.3 Ambari集群中增加DSS专用Client
在ambari控制台菜单,点击下方的hosts菜单,
输入主机名
将master机的id_rsa文件上传
cat .ssh/id_rsa复制有时出错
私钥配置正确,客户机就不必安装agent
如果不使用私钥,也可以在节点上手动安装ambari agent并启动,出现如下提示框:
ambari在客户机上安装的组件,都在
/usr/hdp/current文件夹内
配置文件
/etc/下对应的组件文件夹内,但实际都是到/usr/hdp/current下对应组件配置文件的软链接。
知道这些文件的位置,对于后面配置
HADOOP_HOME、HIVE_HOME、SPARK_HOME以及查找配置文件时有帮助。
采用DSS & Linkis全家桶一键部署安装包(1.3GB)(公众号回复:全家桶安装包)
centos默认在.bashrc中给cp/mv/rm设置了别名,导致安装过程出现很多cp 命令提示是否覆盖安装。输入alias,如果有cp、mv、rm的别名,则应该去掉,以避免大量提示。方法是:
#vi ~/.bashrc
将conf目录下的config.sh.standard.template,修改为config.sh
cp conf/config.sh.standard.template conf/config.sh
您可以按需修改相关配置参数:
vi conf/config.sh
参数说明如下:
在主机上
#mysql –uroot –pMysql12#create database linkis;GRANT ALL PRIVILEGES ON linkis.* TO linkis@'%' IDENTIFIED BY 'sinosoft1234' WITH GRANT OPTION;
注意:安装脚本有两处是相对路径,为了正确安装,所以不要进入bin目录执行脚本。
· install.sh脚本会询问您安装模式。安装模式分为精简版、标准版,请根据您准备的环境情况,选择合适的安装模式。本文档采用2标准版
· install.sh脚本会询问您是否需要初始化数据库并导入元数据,linkis和dss 均会询问。
第一次安装必须选:是。
通过查看控制台打印的日志信息查看是否安装成功。
如果有错误信息,可以查看具体报错原因。
DSS web访问端口:8088
Linkis gateway 的地址:http://127.0.0.1:9001
DSS web 静态文件地址:/dss_linkis/web/dist
DSS web 安装路径:/dss_linkis/web
DSS nginx ip:127.0.0.1
您也可以通过查看我们的安装常见问题(公众号回复:安装常见问题),获取问题的解答。
如果启动产生了错误信息,可以查看具体报错原因。启动后,各项微服务都会进行通信检测,如果有异常则可以帮助用户定位异常日志和原因。
您可以通过查看我们的启动常见问题(公众号回复启动常见问题),获取问题的解答。
可以延长linkis和dss这两个项目 bin 目录下的 start-all.sh中sleep的时间,例如都延长为20秒。
也可以运行sh bin/start-all.sh,直接在控制台上看到服务启动情况
第一个启动的服务是Eureka,它启动后,就可以在Eureka(http://IP地址:20303/)界面查看 Linkis & DSS 后台各微服务的启动情况。如下图,如Eureka主页出现以下微服务,则表示服务都启动成功,可以正常对外提供服务了: