分析NoSQL比较火的三个数据库Memcached、Redis、MongoDB


分析NoSQL比较火的三个数据库Memcached、Redis、MongoDB

文章插图
 
前言
NoSQL,泛指非关系型的数据库 。随着互联网不断的发展,传统的关系数据库在应付新互联网模式的网站,特别是超大规模和高并发的SNS类型的纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展 。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题 。而今天主要讲用得比较多的三个NoSQL:Memcached、redis、MongoDB 。
Memcached
优点
1.Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key、value的字节大小以及服务器硬件性能,日常环境中QPS高峰大约在4-6w左右) 。适用于最大程度扛量 。
2.支持直接配置为session handle 。
缺点
1.只支持简单的key/value数据结构,不像Redis可以支持丰富的数据类型 。
2.无法进行持久化,数据不能备份,只能用于缓存使用,且重启后数据全部丢失 。
3.无法进行数据同步,不能将MC中的数据迁移到其他MC实例中 。
4.Memcached内存分配采用Slab Allocation机制管理内存,value大小分布差异较大时会造成内存利用率降低,并引发低利用率时依然出现踢出等问题 。需要用户注重value设计 。
 
Redis
优点
【分析NoSQL比较火的三个数据库Memcached、Redis、MongoDB】1.支持多种数据结构,如 string(字符串)、 list(双向链表)、dict(hash表)、set(集合)、zset(排序set)、hyperloglog(基数估算) 。
2.支持持久化操作,可以进行aof及rdb数据持久化到磁盘,从而进行数据备份或数据恢复等操作,较好的防止数据丢失的手段 。
3.支持通过Replication进行数据复制,通过master-slave机制,可以实时进行数据的同步复制,支持多级复制和增量复制,master-slave机制是Redis进行HA的重要手段 。
4.单线程请求,所有命令串行执行,并发情况下不需要考虑数据一致性问题 。
5.支持pub/sub消息订阅机制,可以用来进行消息订阅与通知 。
6.支持简单的事务需求,但业界使用场景很少,并不成熟 。
缺点
1.Redis只能使用单线程,性能受限于CPU性能,故单实例CPU最高才可能达到5-6wQPS每秒(取决于数据结构,数据大小以及服务器硬件性能,日常环境中QPS高峰大约在1-2w左右) 。
2.支持简单的事务需求,但业界使用场景很少,并不成熟,既是优点也是缺点 。
3.Redis在string类型上会消耗较多内存,可以使用dict(hash表)压缩存储以降低内存耗用 。
MongoDB
优点
1.更高的写负载,MongoDB拥有更高的插入速度 。
2.处理很大的规模的单表,当数据表太大的时候可以很容易的分割表 。
3.高可用性,设置M-S不仅方便而且很快,MongoDB还可以快速、安全及自动化的实现节点(数据中心)故障转移 。
4.快速的查询,MongoDB支持二维空间索引,比如管道,因此可以快速及精确的从指定位置获取数据 。MongoDB在启动后会将数据库中的数据以文件映射的方式加载到内存中 。如果内存资源相当丰富的话,这将极大地提高数据库的查询速度 。
5.非结构化数据的爆发增长,增加列在有些情况下可能锁定整个数据库,或者增加负载从而导致性能下降,由于MongoDB的弱数据结构模式,添加1个新字段不会对旧表格有任何影响,整个过程会非常快速 。
缺点
1.不支持事务 。
2.MongoDB占用空间过大。
3.MongoDB没有成熟的维护工具 。
Memcached、Redis、MongoDB的区别
1.性能
三者的性能都比较高,总的来讲:Memcached和Redis差不多,要高于MongoDB 。
2.便利性
Memcached数据结构单一 。
Redis丰富一些,数据操作方面,Redis更好一些,较少的网络IO次数 。
MongoDB支持丰富的数据表达,索引,最类似关系型数据库,支持的查询语言非常丰富 。
3.存储空间
Memcached可以修改最大可用内存,采用LRU算法 。
Redis在2.0版本后增加了自己的VM特性,突破物理内存的限制;可以对key value设置过期时间(类似memcached) 。
MongoDB适合大数据量的存储,依赖操作系统VM做内存管理,吃内存也比较厉害,服务不要和别的服务在一起 。
4.可用性
Memcached本身没有数据冗余机制,也没必要;对于故障预防,采用依赖成熟的hash或者环状的算法,解决单点故障引起的抖动问题 。
Redis,依赖客户端来实现分布式读写;主从复制时,每次从节点重新连接主节点都要依赖整个快照,无增量复制,因性能和效率问题,所以单点问题比较复杂;不支持自动sharding,需要依赖程序设定一致hash 机制 。一种替代方案是,不用redis本身的复制机制,采用自己做主动复制(多份存储),或者改成增量复制的方式(需要自己实现),一致性问题和性能的权衡 。


推荐阅读