如何通过增强电池性能彻底改变物联网?
最近在工作中用到了 Hbase 这个数据库,也顺便做了关于 Hbase 的知识记录来分享给大家。其实 Hbase的内容体系真的很多很多,这里介绍的是小羽认为在工作中会用到的一些技术点,希望可以帮助到大家。 可以这么说互联网都是建立在形形色色的数据库之上的,现在主流的数据库有这么几种:以 MySQL 为代表的关系型数据库以及其分布式解决方案,以 Redis 为代表的缓存数据库,以 ES 为代表的检索数据库,再就是分布式持久化 KV 数据库。而在开源领域,尤其是国内,HBase 几乎是分布式持久化KV数据库的首选方案。HBase 应用的业务场景非常之多,比如用户画像、实时(离线)推荐、实时风控、社交Feed流、商品历史订单、社交聊天记录、监控系统以及用户行为日志等等。 前言 我们每一个人无论使用什么科技产品,都会产生大量的数据,而这些数据的存储和查询对于小型数据库来说其实是很难满足我们的需求的,因此出现了 HBase 分布式大数据。HBase 是一个构建在 Hadoop 文件系统之上的面向列的数据库管理系统。HBase 是一种类似于 Google’s Big Table 的数据模型,它是 Hadoop 生态系统的一部分,它将数据存储在 HDFS 上,客户端可以通过 HBase 实现对 HDFS 上数据的随机访问。它主要有以下特性: 不支持复杂的事务,只支持行级事务,即单行数据的读写都是原子性的; 由于是采用 HDFS 作为底层存储,所以和 HDFS 一样,支持结构化、半结构化和非结构化的存储; 支持通过增加机器进行横向扩展; 支持数据分片; 支持 RegionServers 之间的自动故障转移; 易于使用的 Java 客户端 API; 支持 BlockCache 和布隆过滤器; 过滤器支持谓词下推。 HBase 原理 概念 HBase 是分布式、面向列的开源数据库(其实准确的说是面向列族)。HDFS 为 Hbase 提供可靠的底层数据存储服务,MapReduce 为 Hbase 提供高性能的计算能力,Zookeeper 为 Hbase 提供稳定服务和 Failover 机制,因此我们说 Hbase 是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案。 列式存储
我们先来看一下之前的关系型数据库的按行来存储的。如下图: (编辑:信阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |