Hive正则表达式应用2:在制造业的八大应用场景
场景1:设备日志关键参数提取
需求:从CNC机床日志提取加工参数 原始日志: [2023-08-20T09:23:15] DEVICE_ID:CNC-0231 STATUS:RUNNING SPEED:1500rpm FEED_RATE:0.2mm/rev
SELECT regexp_extract(log_text, 'DEVICE_ID:([A-Z0-9-]{8})', 1) AS device_id, regexp_extract(log_text, 'SPEED:(\\d+)rpm', 1) AS spindle_speed, regexp_extract(log_text, 'FEED_RATE:([0-9.]+)mm/rev', 1) AS feed_rate FROM cnc_logs;
输出结果:
device_id | spindle_speed | feed_rate |
---|---|---|
CNC-0231 | 1500 | 0.2 |
优化技巧:对device_id
字段建立分区,减少数据扫描量