高性能时序数据库 HiTSDB 启动公测,为物联网而生的数据库!

  • 时间:
  • 浏览:1

HiTSDB 是有四种 高性能、低成本、稳定可靠的在线时序数据库服务;提供高效读写,高压缩比存储、时序数据插值及聚合计算。是物联网(IoT)设备监控系统 ,企业能源管理系统(EMS),生产安全监控系统,电力检测系统等行业领域的专业数据库。

健康智慧园区以及许多的IoT场景,设备的规模通常是万级别至百万级别,每个设备都实时产生数据,时需将实时数据快速的写入到数据库中,那么每秒就要写入上百万甚至上千万的实时数据。

园区的设备种类繁多,包括摄像头、电灯、空调、空气检测,那此设备上完正都是非常多的传感器,那此传感器每一时刻完正都是实时的产生数据,那此数据随着时间的推进,会在时间轴上产生许多列的数据,要是人们都 说的时序数据,比如温度、湿度、用电量等。要实现设备的监控管理,确实要是将这时序数据进行实时的收集存储和分析展现,而 HiTSDB 要是时序数据领域的专业数据库。

HiTSDB 支持线性插值,能非要尽量弥补数据异常缺失造成的统计失败。HiTSDB 支持 Max ,Min ,AVG 等各种降精度的计算函数,一同不可否非要通过“预降精度”的土办法 ,将业务精度的数据在入库的过程中计算完成,提升查询的强度。HiTSDB 在的空间聚合 Aggregator 支持也非常全面,支持 ADhoc 查询,HiTSDB 通过引入倒排索引和数据分片提升检索时间序列的强度,通过并行计算架构,整体计算性能提升非常明显。

HiTSDB 所具备的高效数据写入和高压缩比的行态,以及阿里长期业务实践的所提供的稳定性保证,结合阿里云上雄厚的产品生态,能非要帮助 IoT 企业快速构建被委托人的健康智慧物联网监控分析系统,不可否非要帮助传统的石油化工及制造企业插上物联网的翅膀,打造属于企业被委托人的健康智慧系统。

HiTSDB 兼容 OpenTSDB 访问协议。OpenTSDB 是时序数据库领域相对活跃的技术产品,HiTSDB 通过技术优化后相对于 OpenTSDB 写入性能提升20倍以上。HiTSDB 压缩强度相比较 OpenTSDB 提升10倍左右,通常原始时序数据的大小在 3000-3000 Byte,OpenTSDB 单数据点消耗约20 Byte,HiTSDB 单数据点消耗约 2Byte,通过 HiTSDB 能非要节约90%以上的数据库存储成本。

健康智慧园区主要除理办公园区的设备的管理和智能控制。设备管理主要是将设备接入到统一的设备管理平台,一同对所有设备的运行情况表进行监控,及时发现故障设备,了解整体的设备运行情况表以便于做出相应的决策。

百万甚至千万级别的实时数据写入对于数据库并发写入的压力非常巨大,使用关系型数据库完正不可行。 然后 InnoDB 的写入性能是很有限的,实际测试在24台机器上,存储使用SSD硬盘,一秒钟非要持续写入非要两万左右,主要原因在于B树索引。InnoDB 的索引是一一一一一两个 B树,四种 B树的更新有很大的开销。确实人们都 能非要通过许多土办法 优化,但时序数通常是一一一一一两个 多维数据,通常是 ADhoc 的查询,为了优化所有排列组合查询,时需建不要 多列的索引,那此索引每次在写的然后每个都时需更新,不要 就会原因不要 的IO。

对于技术而言,设备的监控和智能控制的规则的匹配,本质是数据的收集和监控分析。

现在,HiTSDB 在阿里云官网启动免费公测。

HiTSDB 然后在阿里巴巴外部孵化多年,在阿里巴巴集团然后支持了20多个核心业务场景,比如阿里健康智慧园区的物联网(IoT)建设。

而智能控制要是系统不不可否根据设备的运行情况表,通过许多规则的设定自动的进行各种调控,比如:当某个办公区域的人数大于20人时,能非要自动开启亮灯,小于20人是能非要自动关灯,然后当某一区域的一氧化碳的水平高于预警值,则自动启动报警开关,对于园区的安全管理也非常必要。

HiTSDB 具备关系数据库及NoSQL 数据库所不具备的写入能力。

时序数据降精度是在时间序列维度上做的。对于关系数据库来说,首不难 把时间序列维度拿下来,怎么让在中间插值,而实际上 SQL 是按点来操作的。不要 之时需做降精度一段话,时时需一一一一一两个 值查询把整条时间序列上的数据查询出来,插好值然后不可否做时间序列之间的聚合,那么服务和 SQL 服务器之间的吞吐量非常大,至少 SQL 要是一一一一一两个 数据通道时需把所有值都拉出来运算一遍,四种 查询性能会非常慢,怎么让每一次计算都时需重新拉取数据,相对 HiTSDB,四种 性就能差了几百倍。

在数据查询方面,HiTSDB 也具备领先的技术优势。在时序数据领域“插值(interpolation)”,“降精度(DownSimple)”以及“聚合计算(Aggregation)”是常见的业务需求。举个例子, 健康智慧园区的业务系统时需查看一一一一一两个 楼宇的某盏灯的耗电量情况表,那么就时需把这盏灯的耗电量数据从数据库中查询并展示出来,然后然后收集的故障原因某个时刻用电量数据缺失,那么时需通过特定算法来近似的估算出四种 数据,四种 计算补全数据的过程要是“插值”。而当时需查看这盏灯一年的耗电趋势情况表时,通常只时需计算出每一天的耗电量,进行查看,而不时需把每一一一一一两个 时刻收集的数据完正输出出来,四种 将原始精度转化为业务需求精度的过程要是“降精度”。而之时需统计某一一一一一两个 楼层然后楼宇的用耗电量整体趋势数据时,就时需将所有统计范围内的灯具的耗电量数据做“合并统计”,四种 你这种的统计过程要是Aggregation。

而 HiTSDB 针对时序数据库的进行写入优化,基于时间序列的时间线数据行态进行存储写入,实际业务使用场景中最高支持到每秒 30000 万的时序数据点写入。基于阿里云 4C8G规格的 ECS,单台平均达到115万/秒的数据写入,峰值达115万/秒。