Big Whale(巨鲸)任务调度系统 java开源项目

!
也想出现在这里? 联系我们
信息

简介

巨鲸任务调度平台为美柚大数据研发的分布式计算任务调度系统,提供Spark、Flink等批处理任务的DAG调度和流处理任务的运行管理和状态监控,并具有Yarn应用管理、重复应用检测、大内存应用检测等功能。 服务基于Spring Boot 2.0开发,打包后即可运行。

该项目是一个基于SSH脚本执行机制和Yarn Rest API任务状态同步机制的任务管理平台。它具备部署简单快捷、对Spark和Flink版本无限制、支持失败重试、任务依赖、复杂任务编排(DAG)、流处理任务运行管理和监控以及Yarn应用管理等多项功能。

部署步骤

  1. 准备阶段
    • 确保Java 1.8+环境已安装。
    • 确保Mysql 5.1.0+数据库已安装并可用。
    • 下载项目或使用git clone命令将项目拉取到本地。
    • 为解决github上的README.md图片加载问题,在hosts文件中加入相关域名解析规则。
  2. 安装阶段
    • 在数据库中创建名为big-whale的数据库。
    • 运行big-whale.sql脚本以初始化数据库。
    • 根据Spring Boot环境的配置要求,设置数据库账号密码以及SMTP信息。
    • 配置big-whale.properties文件,根据配置项说明进行相应设置,如SSH用户名、密码、钉钉告警等。
    • 修改$FLINK_HOME/bin/flink文件,因为Flink提交任务时只能读取本地jar包,所以需要在执行提交命令时从hdfs上下载jar包并替换脚本中的jar包路径参数。
    • 使用Maven执行mvn clean package命令进行项目打包。
  3. 启动阶段
    • 检查端口17070是否被占用,如果被占用,则需要关闭占用的进程或修改项目中的端口号配置并重新打包。
    • 拷贝target目录下的big-whale.jar文件。
    • 执行java -jar big-whale.jar命令启动项目。

注意事项

  • 在配置过程中,请确保提供的SSH用户名和密码具有足够的权限来执行脚本。
  • 如果需要开启钉钉告警功能,确保已经获得了正确的钉钉公共群机器人Token。
  • Yarn应用内存上限和白名单列表的设置可以根据实际环境和需求进行调整。
  • Flink配置修改是为了确保在提交任务时能够正确地从hdfs下载并替换jar包路径。
  • 端口检查是为了避免启动时的端口冲突问题。

截图

0606c3638f53991a00dd2bf60257c493

66d4188e6dda8d97858e5a22bfa2c364

e616994f78aae8246afac1f55b2a8629

acb2ce5022e90e959c1d8be905cc43f6

50c891ade747142abc3a32bcab0b9877

3a5c2a701564c5856010479e69ee81ff

817936f07b5946a7f88225c765624fb8

db379387ade3a30b469ba9dd7eeaae7f

cf328b7caf4bbd1fc6e267be01b0529c

79661f2c2eae732de5d315ff0c1c9a59

125dc672900d233a5e0499689fd44e4a

47adf338fc9616839f26446e5745aebf

a9f6a2be2fc0adeca4e35d04c1d64d75

开源地址

© 版权声明
THE END
喜欢就支持一下吧
点赞125 分享
评论 抢沙发

请登录后发表评论

    请登录后查看评论内容