博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
工作流调度
阅读量:6712 次
发布时间:2019-06-25

本文共 337 字,大约阅读时间需要 1 分钟。

【郑州校区】大数据离线阶段Day7之模块开发----工作流调度

整个项目的数据按照处理过程,从数据采集到数据分析,再到结果数据的导出,一系列的任务可以分割成若干个azkaban的job单元,然后由工作流调度器调度执行。
调度脚本的编写难点在于shell脚本。但是一般都是有固定编写模式。大家可以参考资料中的脚本进行编写。大体框架如下:
#!/bin/bash
#set java env
#set hadoop env
#设置一些主类、目录等常量
#获取时间信息
#shell主程序、结合流程控制(if....else)去分别执行shell命令。
更多工作流及hql脚本定义见参考资料。

转载于:https://blog.51cto.com/13587708/2287400

你可能感兴趣的文章
慎用!BLEU评价NLP文本输出质量存在严重问题
查看>>
如何撰写好文档?精益文档的六个实践
查看>>
ArchSummit微课堂|蘑菇街DevOps实践及心路历程分享
查看>>
随手记统一监控平台Focus设计解析
查看>>
中国平安“豪赌”科技?从产险业务IT变形计聊起
查看>>
RSocket:一个面向反应式应用程序的新型应用网络协议
查看>>
ElasticSearchDsl
查看>>
SciPy达到1.0版本,有了新的治理结构
查看>>
IntelliJ IDEA 2018.3 新版本发布,支持 Java 12及Spring Boot增强等特性
查看>>
Go语言很好很强大,但我有几个问题想吐槽
查看>>
独家!支付宝小程序技术架构全解析
查看>>
微软宣布针对Azure Cosmos DB的多个更新
查看>>
GitHub安全告警检测出了400多万个漏洞
查看>>
如何在Python中使用LightFM构建可扩展的电子商务推荐系统?
查看>>
畅谈云原生(上):云原生应用应该是什么样子?
查看>>
取代ZooKeeper!高并发下的分布式一致性开源组件StateSynchronizer
查看>>
AlloyTouch实现下拉刷新
查看>>
Wiki工具使用感悟
查看>>
云因成本高昂屡被关注,上云的价值是什么?
查看>>
深入探索JVM自动资源管理
查看>>