当前位置: 代码网 > it编程>编程语言>Java > MR3加速hive和spark任务

MR3加速hive和spark任务

2024年08月05日 Java 我要评论
凭借其先进的资源共享模型,MR3上的Hive可以节省大量成本,尤其是在许多ETL作业并发运行的情况下。与仍然需要Java8的ApacheHive不同,MR3上的Hive可以与Java17一起运行。普通Spark,不同的Spark应用程序必须维护自己的一组executor,因为Spark缺乏在Spark应用程序之间回收计算资源的功能。MR3上的Hive无需额外配置即可自动达到LLAP及以上的速度。2、MR3上的Hive比Tez上的Hive实现了更高的吞吐量。3、MR3上的Hive支持Java17。

mr3是一个通用的执行引擎,原生支持hadoop和kubernetes。

hive on mr3
0、mr3上的hive很稳定,向后移植了大约800个安全和关键补丁。

1、mr3上的hive实现了llap甚至更高的速度
llap(低延迟分析处理)是hive的主要组件,它使其性能远远超过竞争技术。
然而,由于其复杂的架构,启用llap非常困难。mr3上的hive无需额外配置即可自动达到llap及以上的速度。

2、mr3上的hive比tez上的hive实现了更高的吞吐量
hiveontez的一个常见用例是运行etl(提取-转换-加载)作业。凭借其先进的资源共享模型,mr3上的hive可以节省大量成本,尤其是在许多etl作业并发运行的情况下

3、mr3上的hive支持java17
与仍然需要java8的apachehive不同,mr3上的hive可以与java17一起运行。通过切换到java17,mr3上的hive可以将运行时间减少多达30%。

4、.mr3上的hive支持remoteshuffle服务
remoteshuffle服务因其众多潜力而被越来越多的技术采用。
mr3上的hive也在快速发展,以支持remoteshuffle服务。
目前hiveonmr3支持apacheceleborn作为remoteshuffle服务,可以消除95%以上的本地磁盘写入。

5、没有供应商锁定
在mr3上运行hive意味着不存在供应商锁定的风险。由于mr3上的hive与hivemetastore一起运行,因此用户可以随时切换回apachehive或其他技术。

spark on mr3
允许多个spark应用程序共享计算资源,例如yarncontainer或kubernetespod。
普通spark,不同的spark应用程序必须维护自己的一组executor,因为spark缺乏在spark应用程序之间回收计算资源的功能。
sparkonmr3易于使用在hadoop和kubernetes上,因为它与apachespark的不同之处仅在于任务调度和资源管理。除了在spark应用程序中回收containerworkers之外,用户还可以利用mr3的容错、推测执行和自动缩放等特性。

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com