找回密码
 注册
搜索
热搜: 活动 交友
查看: 110|回复: 0

数据库管理本身在亚马逊云中进行

[复制链接]

1

主题

0

回帖

5

积分

新手上路

积分
5
发表于 2023-11-13 16:22:32 | 显示全部楼层 |阅读模式
这已包含在成本中。简单地说,就像比较 100 万美元和 1,000 美元一样简单(这是三个全零!)。事实上,我认为很难找到一个理由来解释这种价格差距。这就是为什么有关 Redshift 的争论如此之多。在 Integrate.io,我们在 Hadoop 上对相同查询运行了基准测试(使用 Hive 和相同的 SQL 查询),我们发布的结果表明,即使仅比较正常执行成本,Redshift 在速度和成本方面也优于 10 倍以上。曾经,我们的基准是 SlideShare 上最热门的幻灯片,这恰恰表明了 Amazon Redshift 引起了大数据专家的高度兴趣。 红移 Hadoop1 红移 Hadoop2 回去工作。


我们将处理您的 ETL 管道。 数据仓库的功能 首先,Redshift最大的特点就是它的列式存储技术。顾名思义,面向列的数据结构按列存储数据,而不是传统的面向行的数据库。当使用索引时,传统数据库可以很 沙特阿拉伯电报号码数据 好地立即从特定行检索数据,但它们对于所有记录的聚合函数来说并不那么好,因为必须处理额外的数据。列式数据库非常适合只需要处理少数特定列的聚合处理。另外,压缩效率要高得多,因为特定数据在单个列中重复是很常见的。Redshift 从七种不同的压缩算法(截至 2 月 28 日)中为每列进行选择。它还为您提供了检测将要加载的数据或已保存的数据的最佳压缩方法的方​​法。



即使使用大数据,也能以惊人的速度获得结果,因为只检索查询所需的压缩列。Hadoop 有一些补充模块,可以利用柱状方向的优点(RCFile、HBase 等),但它们存在一些技术障碍。根据我的经验,这些模块并不经常使用,需要更深入的 Hadoop 知识。但与其他数据仓库相比,Redshift 真正突出的特点是它的可扩展性,正如 Amazon 所期望的那样。通过大规模并行处理(MPP),随着数据量的增长,可以添加处理和存储节点以保持或提高处理速度。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黒屋|Quetzal Audio

GMT+9, 2025-2-24 09:36 , Processed in 0.828157 second(s), 18 queries .

Powered by Discuz! X3.5

Copyright © 2001-2025 Tencent Cloud.

快速回复 返回顶部 返回列表