您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息
免费发信息
三六零分类信息网 > 毕节分类信息网,免费分类信息发布

Redis分区方案

2024/3/20 22:49:39发布29次查看
最近在学习redis,看到官方文档中的partioning部分不错,顺手翻译过来,加深理解。文中很多思路和方法虽然比较常见,但是值得重新阅读,并且也适用于其他kv或cache方案。 原文地址:http://redis.io/topics/partitioning 分区:如何在多个redis实例中分割数
最近在学习redis,看到官方文档中的partioning部分不错,顺手翻译过来,加深理解。文中很多思路和方法虽然比较常见,但是值得重新阅读,并且也适用于其他kv或cache方案。
原文地址:http://redis.io/topics/partitioning
分区:如何在多个redis实例中分割数据分区是分割数据到多个redis实例的处理过程,因此每个实例只保存key的一个子集。文档的第一部分会介绍分区的概念,第二部分会展示redis分区的可选方案。
为什么分区有用redis分区有两个主要目的:
可以支持更大的数据库,使用很多计算机的所有内存。没有分区,就被限制在单台计算机所能支持的最大内存。
可以扩展多核和多个计算机的计算能力,还有多个计算机和网络适配器的网络带宽。
分区基础有不同的分区标准。假设有4个redis实例 r0,r1,r2,r3,和类似user:1,user:2这样的表示用户的多个key,对既定的key有多种不同方式来选择这个key存放在哪个实例中。也就是说,有不同的系统来映射某个key到某个redis服务。
最 简单的分区方式是按范围分区,就是映射一定范围的对象到特定的redis实例。比如,id从0到10000的用户会保存到实例r0,id从10001到 20000的用户会保存到r1,以此类推。这种方式是可行的,并且在实际中使用,不足就是要有一个区间范围到实例的映射表。这个表要被管理,同时还需要各 种对象的映射表,通常对redis来说并非是好的方法。
另外一种分区方法是hash分区。这对任何key都适用,也无需是object_name:这种形式,像下面描述的一样简单:
用一个hash函数将key转换为一个数字,比如使用crc32 hash函数。对key foobar执行crc32(foobar)会输出类似93024922的整数。
对这个整数取模,将其转化为0-3之间的数字,就可以将这个整数映射到4个redis实例中的一个了。93024922 % 4 = 2,就是说key foobar应该被存到r2实例中。注意:取模操作是取除的余数,通常在多种编程语言中用%操作符实现。
有很多实现分区的其他方法,基于这两个例子,你应该有了认识。hash分区的一种更高级形式叫一致性hash,有些redis客户端和代理已经实现。
分区的不同实现分区可以是软件系统中不同部分来实现。
客户端分区 意味着客户端直接选择对应的节点,被给定key读取或写入。很多redis客户端实现了客户端分区。
代理辅助分区 意味着客户端发送请求给实现redis协议的代理,而非直接发送请求给对应的redist实现。代理会参照配置好的分区策略,保证转发请求给正确的redis实例,也会给客户端返回响应。redis和memcached代理twemproxy实现了代理辅助分区。
查询路由 意味着发送请求给一个随机的实例,这个实例会保证转发请求到正确的节点。在客户端的帮助下,redis集群实现了一种混合形式的查询路由(请求不是直接从一个redis实例转发到另一个实例,而由客户端重定向到正确的节点)。
分区不足之处redis的某些特性在分区环境下不能充分发挥:
多key操作通常无法支持。比如,如果两个key被映射到不同的redis实例,无法对两个set取交集(实际有方法实现,但不能非直接实现)。
多key的事务无法使用。
分区粒度是关键,因此,不可能对一个key下面有非常多元素的sorted set分片。
使用分区时,数据处理更复杂。不得不处理多个rdb/aof文件,做数据备份时需要合并来自多个实例和机器的持久文件。
添加或删除容量可能会复杂。比如,redis集群计划支持透明重新平衡数据的能力,以支持运行时添加和删除节点,但是其他采用客户端分区和代理的系统就不支持这个特性。但是,presharding预分片技术在这方面会有帮助。
数据存储还是cache?使 用redis做为存储或cache,分区在概念上是相同的, 但是有一个巨大的差别。redis做为数据存储时,要保证给定key总是映射到相同的实例,而redis做为cache时,一个给定节点不可用,如果开始 使用一个不同的node,不会有太大问题,只要我们愿意,更新key和实例的映射以提升系统可用性(即,对查询响应的系统能力)。
如果给定key的首选节点不可用,一致性hash实现常可以切换到其他节点。类似的,如果添加一个新节点,部分新key开始存到新节点上。
以下是主要概念:
如果redis用作cache,使用一致性hash容易向上向下扩展。
如果redis用作存储,要在key和固定节点之间做映射,并且有固定数量的节点。否则在增加或删除节点时,就需要一个系统节点之间对key做迁移。当前,只有redis集群可以实现,但是在生产环境还不能用。
预分片我们了解到,分区是个问题,除非我们使用redis做为cache,添加删除节点可能会困难,使用固定的key和实例映射会简单的多。
数据存储需求随着时间变化,今天我可能使用10个redis节点,明天可能就需要50个节点。
redis非常小和轻量(一个备用实例仅适用1mb内存容),解决分片问题的一个简单方法是一开始就启动多个实例。即使你只启动一个服务器,第一天就使用分布式,单台服务器上运行多个redis实例,来使用分区。
从一开始你可以将实例数开的很大,比如32或64个实例,对大多数用户足够满足增长需要。
随着你的存储需求增长,需要更多的redis服务器,使用这种方式,要做的就是简单的将实例从一台服务器移到另一台。一旦添加了第一个额外的服务器,需要将一半的redis实例从第一台服务器移到第二台,以此类推。
使用redis复制你可能会最小代价迁移,对用户无需停机:
在你的新服务器上启动空实例
迁移数据配置这些新实例做为源实例的备机
停止客户端
使用新的服务器ip更新迁移实例的配置
发送slaveof no one命令到新服务器上的备机
用新更新的配置重启客户端
最后关闭老服务器上不再使用的实例
redis分区实现到现在,理论上覆盖了redis分区,但是实际中怎么样?你会使用什么方案?
redis集群不幸的是,redis集群现在还不能在生产环境使用,但是可以阅读规范或了解现在不稳定分支的部分实现,以获得更多相关信息。
一旦redis集群可用,并且redis集群兼容客户端在你所用编程语言中可用,redis集群会成为事实上的redis分区标准。
redis集群是一种查询录用和客户端分区的混合解决方案。
twemproxytwemproxy 是twitter为memchache ascii和redis协议开发的一个代理。单线程,c语言开发,非常快。基于apache 2.0 license的开源软件。
twemproxy支持自动在多个redis实例间自动分区,节点不可用时可以屏蔽(这会改变key和实例映射关系,应该在将redis做为cache使用时才用这项特性)。
没有单点故障,因为你可以启动多个代理引导客户端连接首先接受连接的那个。
基本上,twemproxy是一个介于客户端和redis实例之间的中间层,用最小的额外复杂度来可靠的分区。目前是处理redis分区的推荐方式。
可以通过这篇blog了解更多关于twemproxy的信息。
支持一致性hash的客户端twemproxy的可选方案是,使用使用一致性 hash或类似算法的客户端分区。有多个redis客户端都支持一致性hash,特别是redis-rb和predis。
查看完整的redis客户端列表,以检查是否有你使用的编程语言的实现一致性hash的合适客户端。
原文地址:redis分区方案, 感谢原作者分享。
毕节分类信息网,免费分类信息发布

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录