IoTDB 入门教程 基础篇①——时序数据库为什么选IoTDB ?

07-10 1597阅读

文章目录

  • 一、前文
  • 二、性能排行第一
  • 三、完全开源
  • 四、数据文件TsFile
  • 五、乱序数据高写入
  • 六、其他
  • 七、参考

    一、前文

    IoTDB入门教程——导读

    关注博主的同学都知道,博主在物联网领域深耕多年。

    时序数据库,博主已经用过很多,从最早的InfluxDB,到后期的TDengine,以及现在的IoTDB。

    • 最早是没得选,只能用InfluxDB。
    • 后面是有的选,换了TDengine。
    • 现在是选择太多,择优选了IoTDB。

      各个时序数据库的厂家,随着版本更新,性能越来越强,越来越好用,也越来越易用。

      本文主要讲述IoTDB的优势,时序数据库选择困难症的同学可以看看。已经选定IoTDB的同学可以直接看后面的应用实战。

      二、性能排行第一

      正如俗语所言:“是骡子是马,拉出来遛遛。”

      benchANT,一家位于德国的权威机构,专注于云设施和数据库性能评估。

      benchANT 数据库性能排行榜链接:https://benchant.com/ranking/database-ranking

      Workload Type选择Time Series: DevOps。

      时序数据的特点显著,包括测量点众多、上报频率高以及数据规模庞大等。

      因此,时序数据库面临的挑战也不容小觑:必须保证高频写入的速度、海量数据查询的迅捷以及数据存储成本的优化。

      鉴于这些独特的需求,选择性能强大的时序数据库变得至关重要。

      毕竟,如果MySQL能够满足这些要求,我们也不会特意去寻找更适合的时序数据库了。

      IoTDB 入门教程 基础篇①——时序数据库为什么选IoTDB ?

      三、完全开源

      • 从数据文件到分布式,不依赖第三方系统,国产自研,完全开源。

      • Apache 基金会唯一时序数据库 Top-Level 项目Apache / IoTDB。

      • 产学研结合, 拥有 30+ 时序数据管理领域发明专利,在数据库顶会发表 10+ 篇论文。

      • 发源于清华大学,其核心团队成立了天谋科技(北京)有限公司,专注 IoTDB 产品的打磨。

        四、数据文件TsFile

        物联网时序数据文件格式:Apache / TsFile

        众所周知,数据文件如何高效的压缩和读写是数据库设计的一大关键。

        而数据文件又处于很底层,大部分数据库厂家不对外提供这方面的资料。

        但是IoTDB却把这方面的项目独立出来,成为又一个Apache Top-Level 项目Apache / TsFile。实在是不得不佩服。

        TsFile是一种为时间序列数据设计的列式存储文件格式,它支持高效压缩、高读写吞吐量,并且兼容多种框架,如Spark和Flink。TsFile很容易集成到物联网大数据处理框架中。

        • 高效的存储和压缩:TsFile采用了先进的压缩技术来最大限度地减少存储需求,从而减少了磁盘空间消耗并提高了系统效率。
        • 灵活元数据组织管理:TsFile允许在不预先定义模式的情况下直接写入数据,支持数据灵活获取。
        • 高性能时间范围查询:高性能时间范围查询
        • 大数据生态无缝集成:TsFile能够与现有的时间序列数据库(如IoTDB)、数据处理框架(如Spark和Flink)无缝集成。

          TsFile API 快速上手

          讲到这里又不得不提到TDengine,TDengine虽然版本更新很快,性能也很强。

          但是他们底层数据文件也经常修改,不仅2.x与3.x版本的数据文件不兼容,3.0.0.1版本与3.0.2.0版本的数据文件也不兼容。

          因为3.0.0.1的底层数据文件不稳定,所以后面版本就及时做了大改,所以导致的不兼容。

          底层数据文件不稳定就很容易出现大问题,数据丢失,数据无法正常迁移等等。

          这里也没有踩踏TDengine的意思,TDengine也很好,只不过通过对比,感觉IoTDB更好。

          一群清华的硕士博士做出来的东西,确实靠谱。

          五、乱序数据高写入

          IoTDB不仅支持高频的数据写入,还支持乱序数据写入。

          乱序数据是指:早产生的数据后到了,晚产生的数据先到了

          这是我们在实际应用中经常遇到的场景,会带来一些困扰,虽然不痛,但也很烦。

          IoTDB首创了乱序分离存储引擎用独有的顺乱序判断的机制,将顺序数据与乱序数据分开,并通过多种空间合并的方法,去消除乱序数据。

          IoTDB 入门教程 基础篇①——时序数据库为什么选IoTDB ?

          六、其他

          IoTDB不仅功能丰富,而且具有诸多优势和亮点。只不过这些博主目前暂时用不到,所以这里就快速过一下,留个印象,后面实际项目有需要的时候自然会想起来。

          • 全面的端-边-云协同模式:IoTDB支持边缘模式、单机模式以及分布式架构,为用户提供了灵活多样的部署选项。
          • 专为物联网打造:IoTDB拥有设备测点物联网数据模型、IoTLSM物联网存储引擎和IoTConsensus物联网共识协议,确保数据在物联网环境中的高效管理和传输。
          • 卓越的性能表现:通过已有案例展示,IoTDB能够轻松管理亿级序列,实现数千万点/秒的吞吐能力,并提供高达十倍的压缩比,大大提升了数据处理效率。
          • 树形时序数据模型:IoTDB采用树形结构进行时序数据建模,确保这些关键数据能够被有效、有序地管理和查询。
          • 智能分析功能(AINode):IoTDB积极拥抱AI技术,提供了智能化的分析功能。它涵盖了多种适用于时序数据的算法和自研模型,能够实现序列预测、异常检测等高级分析场景,为用户提供深入的洞察力。
          • 强大的处理能力:IoTDB支持丰富的时序特性查询和分析功能,满足用户在各种复杂场景下的数据处理需求。

            七、参考

            时序数据库IoTDB:功能详解与行业应用

            觉得好,就一键三连呗(点赞+收藏+关注)

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]