云计算简史(完整版)( 六 )
键值存储
ArangoDB, Aerospike, Couchbase, Redis
键值 存储 (最终一致)
Oracle NoSQL Database, Dynamo, Riak, Voldemort
键值存储 (序列化)
FoundationDB, InfinityDB, LMDB, MemcacheDB
元组存储
Apache River, GigaSpaces
对象数据库
Objectivity/DB, Perst, ZopeDB
文档数据库
ArangoDB, BaseX, Clusterpoint, Couchbase, CouchDB, DocumentDB, eXist-db, IBM Domino, MarkLogic, MongoDB, Qizx, RethinkDB, Elasticsearch
宽表存储
Amazon DynamoDB, Bigtable, Cassandra, Scylla, HBase, Hypertable
多模数据库
ArangoDB, Cosmos DB, OrientDB, MarkLogic
读者可以忽略其中的细节技术语言 , 只需要了解不同类型的NoSQL数据库会有利于特定场景的应用开发 。 比如文档数据库采用JSON格式存储 , 可以随心所欲定义不同的数据结构 , 而且横向扩展性很强(数据规模增大后可以保证查询效率) 。 我们明道云的工作表就是利用了文档数据库MongoDB作为存储方案 。
NoSQL数据库普遍支持分布式文件系统 , 所以都具备很强横向扩展性 。 和关系数据库相比 , NoSQL数据库大多不具备事务一致性 , 但是这个牺牲交换得到数据处理的效率 , 因而作为大数据技术相关的常见存储方案 。
云计算平台上的大数据服务
以上我们介绍了大数据技术发展依赖的各个重要技术栈 。 很显然 , 和传统的应用开发相比 , 大数据技术相对更加复杂 。 它不仅涉及复杂的编程框架 , 还需要一个专业的运维体系 。 这使得大部分普通企业用户很难自己来搭建大数据开发环境 。 所以云计算平台在基础云服务之外 , 也开始结合云计算资源提供大数据服务 。 阿里云上的MaxCompute是一个全托管的大数据SaaS服务 , 用户甚至无需管理主机基础设施 , 直接按照大数据计算任务量付费 。 顺便说一下 , 这种直接将计算服务提供给开发者的模式被称为“无服务器”(Serverless)计算 , 它的目的是为了简化开发工作中的运维任务 , 让开发者聚焦在应用开发上 。 不仅仅是大数据领域 , 在AI , 物联网等其他技术领域 , 无服务器服务模式正在日益成为主流 。 E-MapReduce则是一整套大数据相关的PaaS服务 , 用户可以选择利用现成的服务在自己控制的云主机上完成部署 , 客户主要支付的是基础云的资源费用 。 和阿里云类似 , 亚马逊AWS等其他云计算平台也提供丰富的大数据相关平台服务 。
应用领域
我们前面提到大数据技术起源于搜索引擎应用 。 在随后的十多年中 , 它的主要应用场景依然还是在互联网领域 。 最常见的应用包括计算广告(依据用户和内容数据动态决定广告投放策略和定价) , 内容检索和推荐(百度、头条) , 商品推荐和营销活动优化(淘宝、拼多多) 。 不要小看这几个场景 , 它们几乎和互联网用户上网过程中的每一分秒都有关系 , 所以创造了巨大的经济价值 。
数据的价值当然不仅仅局限于互联网行业 , 几乎每个产业都有机会在大数据技术的帮助下发掘出数据的价值 , 或者改善运营效率 , 或者发现出新的业务机会 。 金融行业是较早的受益者 。 银行贷款业务中的风险控制、零售和结算业务中的欺诈发现、保险业务中的精算和保单个性化定价、证券行业中的期货定价和股价预测等都实实在在在创造出财富 。
大数据在研究和开发领域也在大显身手 。 在生物医药领域 , 大数据技术在帮助缩短药物研发的周期和提高成功率;合成化学行业也在利用大数据和机器学习技术来加快发现新材料 。 有人甚至认为数据科学将成为实验、推演和仿真以外的一种新的科学研究方法 , 成为“第四范式” 。
大数据在城市交通、社会治理、能源传输、网络安全、航空航天等领域也都已经有了现实的应用 。 但在这些资本投入密集的领域之外 , 大数据在一般行业和企业中的应用依然道路曲折 。 这不是因为大数据技术不够完善 , 而是诸多行业尚未能够明确抽象出大数据应用的价值以及可付诸实施的方法论 。 正如前面提到的 , 云计算和大数据对于普通中小企业来说依然是一个模糊的技术工具 , 一般企业也很难雇佣大数据专家 , 而专业服务企业目前还没有找到利用自己的技术专长提供普遍服务的有效机会 。 通用领域中的大数据应用还停留在理念阶段 。 所以 , 在过去几年出现的大数据技术公司大多都还在服务金融、公安、交通、能源等大客户集中的行业 。
推荐阅读
- 互联网|中国互联网大佬直播简史
- Epic|喜加一:EPIC限时免费领取独立恐怖题材冒险游戏《DARQ:完整版》
- 学生|她值得!张桂梅被写进中华人民共和国简史 网友纷纷留言致敬
- 张桂梅被写进《中华人民共和国简史》!网友3字留言刷屏
- 云计算|阿里云发布全新容器服务ACK Anywhere:四大核心能力、统一集群管理
- 华为|华为3亿元成立深圳云计算公司 云业务已成国内第二
- 完整版|25秒!周杰伦公布新歌MV前奏,吊足胃口
- 中青报整版聚焦付费刷课乱象:每门4至6元,“不学而过”
- 云计算|Windows 365云电脑配置公布:最高8核、512GB 随时随地访问
- 华为|手机业务被打压 华为发力云计算:份额国内第二、仅次于阿里