TDengine时序数据库详解

思静鱼

于 2025-07-22 11:39:40 发布

阅读量1.3k

点赞数 29

CC 4.0 BY-SA版权

分类专栏： # Mysql-数据库文章标签：时序数据库 tdengine 大数据

本文链接：https://blog.csdn.net/Fireworkit/article/details/149532059

Mysql-数据库专栏收录该内容

53 篇文章

订阅专栏

1. TDengine 简介

TDengine 是一款 高性能、分布式、支持 SQL 的时序数据库（Time-Series Database, TSDB），专为 物联网（IoT）、工业互联网、金融监控、日志分析 等场景设计。其核心特点包括：

超高性能：单机每秒百万级写入，查询速度比传统数据库快 10 倍以上。
低存储成本：采用列式存储 + 压缩算法，存储空间节省 90%+。
完整 SQL 支持：兼容标准 SQL，支持时间窗口聚合、降采样等时序计算。
分布式架构：支持水平扩展，适应海量数据存储。
开源：核心代码开源（Apache 2.0 协议）。

2. 核心架构

(1) 存储引擎

列式存储：数据按列存储，提高压缩率和查询效率。
时间分区：按时间自动分片（如按天/小时），加快时间范围查询。
多级存储：支持内存、SSD、HDD 分层存储，冷热数据分离。

(2) 计算引擎

流式计算：内置窗口函数、连续查询（Continuous Query）。
分布式计算：支持多节点并行查询。

(3) 数据模型

超级表（Super Table）：定义同一类设备的表结构（类似关系型数据库的“表模板”）。
子表（Sub Table）：每个设备对应一个子表，自动管理。
标签（Tags）：设备的元数据（如设备 ID、位置），用于高效过滤。

3. 核心功能

(1) 高性能写入

批量写入：支持单条或批量插入，建议批量提交以提高吞吐量。

INSERT INTO meter_001 USING meters TAGS ('device1', 'Beijing') VALUES (now, 23.5, 0.8);

异步写入：客户端可配置异步提交，降低延迟。

(2) 高效查询

时间窗口聚合：

SELECT AVG(voltage) FROM meters 
WHERE ts >= '2023-01-01' AND ts < '2023-01-02' 
INTERVAL(1h);

降采样（Downsampling）：

SELECT FIRST(voltage) FROM meters SAMPLE BY 10m;

(3) 数据压缩

默认压缩率 5:1，可通过配置选择不同压缩算法（如 LZ4、ZSTD）。

(4) 流式计算

连续查询（CQ）：自动计算并存储聚合结果。

CREATE CONTINUOUS QUERY cq_1 
RESAMPLE EVERY 10s 
AS SELECT AVG(voltage) INTO avg_voltage FROM meters;

(5) 分布式扩展

水平分片：按时间或哈希分片，支持多节点集群。
负载均衡：自动分配数据到不同节点。

4. 适用场景

场景	优势
物联网（IoT）	海量设备数据高并发写入，低存储成本。
工业互联网	实时监控设备状态，支持高频采样数据存储。
金融监控	毫秒级行情数据存储与查询。
日志分析	高效存储和检索时间序列日志（如服务器指标、APM 数据）。
能源管理	电表、水表等计量数据长期存储与分析。

5. 竞品对比

数据库	特点	适用场景
InfluxDB	开源 TSDB，生态丰富，但集群版闭源。	监控、DevOps
TimescaleDB	基于 PostgreSQL 的时序扩展，支持完整 SQL。	混合业务+时序场景
OpenTSDB	基于 HBase，适合大规模监控，但架构复杂。	Hadoop 生态集成
TDengine	高性能、低存储成本，一体化设计。	IoT、工业互联网、金融

6. 快速入门

(1) 安装

# Linux
wget https://www.taosdata.com/assets-download/TDengine-server-3.x.x-Linux-x64.tar.gz
tar -xzvf TDengine-server-3.x.x-Linux-x64.tar.gz
cd TDengine-server-3.x.x && ./install.sh

# 启动服务
systemctl start taosd

(2) 基本操作

-- 创建数据库
CREATE DATABASE mydb;
USE mydb;

-- 创建超级表（定义设备模板）
CREATE STABLE meters (ts TIMESTAMP, voltage FLOAT, current FLOAT) 
TAGS (device_id NCHAR(50), location NCHAR(50));

-- 插入数据（自动创建子表）
INSERT INTO meter_001 USING meters TAGS ('device1', 'Beijing') VALUES (now, 23.5, 0.8);

-- 查询
SELECT * FROM meters WHERE location = 'Beijing';

(3) 客户端连接（REST / JDBC / Python）

# Python 示例
from taos import connect

conn = connect(host="localhost", user="root", password="taosdata")
cursor = conn.cursor()
cursor.execute("SELECT * FROM meters LIMIT 10")
print(cursor.fetchall())

7. 性能优化

(1) 写入优化

批量插入：单次插入多条数据（建议 100~1000 条/批）。
异步写入：配置客户端异步提交。

(2) 查询优化

使用时间分区：按时间范围查询时，避免全表扫描。
合理使用标签：通过 TAGS 字段加速过滤。

(3) 存储优化

调整压缩算法：根据数据特征选择 LZ4（速度优先）或 ZSTD（压缩率优先）。
冷热数据分离：旧数据迁移到低成本存储。

8. 局限性

事务支持有限：不适合强事务场景（如银行核心系统）。
非时序数据不适用：关系型数据建议用 MySQL/PostgreSQL。

9. 学习资源

官网文档: https://www.taosdata.com
GitHub: https://github.com/taosdata/TDengine
社区论坛: https://community.taosdata.com

总结

TDengine 是时序数据处理领域的 高性能、低成本解决方案，特别适合 IoT、工业互联网、金融监控 等场景。其 列式存储、分布式架构、完整 SQL 支持 使其在时序数据库中脱颖而出。对于需要 高吞吐写入、低存储成本、实时分析 的场景，TDengine 是最佳选择之一。