不做冤大头，免费学代码！CNN-LSTM-Attention/CNN-LSTM/LSTM三模型多变量时间序列光伏功率预测一键对比 Matlab

本文链接：https://blog.csdn.net/2301_79294434/article/details/149855348

基于Matlab的CNN-LSTM-Attention、CNN-LSTM和LSTM三模型对比框架，用于多变量时间序列光伏功率预测的一键式解决方案：

%% 光伏功率预测三模型对比系统
clear; clc; close all;

%% 1. 数据准备
% 假设数据格式：时间戳 × 特征变量 (最后一列为功率值)
% 特征示例：温度、辐照度、湿度、风速、历史功率等
load('pv_data.mat');  % 替换为实际数据文件

% 参数设置
numTimeSteps = size(pv_data,1);     % 时间步总数
numFeatures = size(pv_data,2)-1;    % 特征数（不包括目标）
lookback = 24;                      % 历史窗口大小（小时）
forecastHorizon = 1;                % 预测步长（小时）

% 数据标准化
[dataNormalized, mu, sigma] = zscore(pv_data);
powerIdx = size(pv_data,2);  % 功率列索引

% 创建时间序列数据
[X, Y] = createTimeSeriesData(dataNormalized, lookback, forecastHorizon, powerIdx);

% 数据集划分
trainRatio = 0.7;
valRatio = 0.15;
testRatio = 0.15;

[trainInd, valInd, testInd] = divideblock(size(X,1), trainRatio, valRatio, testRatio);

XTrain = X(trainInd,:,:);
YTrain = Y(trainInd);
XVal = X(valInd,:,:);
YVal = Y(valInd);
XTest = X(testInd,:,:);
YTest = Y(testInd);

%% 2. 模型定义与训练
% 通用训练选项
options = trainingOptions('adam', ...
    'MaxEpochs', 50, ...
    'MiniBatchSize', 64, ...
    'ValidationData', {XVal, YVal}, ...
    'ValidationFrequency', 30, ...
    'Plots', 'training-progress', ...
    'Verbose', true);

% 2.1 LSTM模型
lstmLayers = [ ...
    sequenceInputLayer(numFeatures)
    lstmLayer(128, 'OutputMode', 'last')
    fullyConnectedLayer(64)
    reluLayer
    fullyConnectedLayer(1)
    regressionLayer];

lstmNet = trainNetwork(XTrain, YTrain, lstmLayers, options);

% 2.2 CNN-LSTM模型
cnnLstmLayers = [ ...
    sequenceInputLayer(numFeatures)
    
    % CNN部分
    convolution1dLayer(3, 64, 'Padding', 'same')
    batchNormalizationLayer
    reluLayer
    maxPooling1dLayer(2, 'Stride', 2)
    
    convolution1dLayer(3, 128, 'Padding', 'same')
    batchNormalizationLayer
    reluLayer
    maxPooling1dLayer(2, 'Stride', 2)
    
    % LSTM部分
    flattenLayer
    lstmLayer(128, 'OutputMode', 'last')
    
    % 回归头
    fullyConnectedLayer(64)
    reluLayer
    fullyConnectedLayer(1)
    regressionLayer];

cnnLstmNet = trainNetwork(XTrain, YTrain, cnnLstmLayers, options);

% 2.3 CNN-LSTM-Attention模型
inputLayer = sequenceInputLayer(numFeatures, 'Name', 'input');

% CNN特征提取
convBlock = [
    convolution1dLayer(3, 64, 'Padding', 'same', 'Name', 'conv1')
    batchNormalizationLayer('Name', 'bn1')
    reluLayer('Name', 'relu1')
    maxPooling1dLayer(2, 'Stride', 2, 'Name', 'pool1')
    
    convolution1dLayer(3, 128, 'Padding', 'same', 'Name', 'conv2')
    batchNormalizationLayer('Name', 'bn2')
    reluLayer('Name', 'relu2')
    maxPooling1dLayer(2, 'Stride', 2, 'Name', 'pool2')
    
    flattenLayer('Name', 'flatten')];

% LSTM时序建模
lstmBlock = [
    lstmLayer(128, 'OutputMode', 'sequence', 'Name', 'lstm')
    selfAttentionLayer(128, 'Name', 'attention')];  % 自定义注意力层

% 回归输出
regressionHead = [
    fullyConnectedLayer(64, 'Name', 'fc1')
    reluLayer('Name', 'relu3')
    fullyConnectedLayer(1, 'Name', 'fc2')
    regressionLayer('Name', 'output')];

% 组装网络
lgraph = layerGraph(inputLayer);
lgraph = addLayers(lgraph, convBlock);
lgraph = addLayers(lgraph, lstmBlock);
lgraph = addLayers(lgraph, regressionHead);

lgraph = connectLayers(lgraph, 'input', 'conv1');
lgraph = connectLayers(lgraph, 'flatten', 'lstm');
lgraph = connectLayers(lgraph, 'attention', 'fc1');

% 训练模型
cnnLstmAttNet = trainNetwork(XTrain, YTrain, lgraph, options);

%% 3. 预测与评估
% 测试集预测
lstmPred = predict(lstmNet, XTest);
cnnLstmPred = predict(cnnLstmNet, XTest);
cnnLstmAttPred = predict(cnnLstmAttNet, XTest);

% 反标准化预测结果
lstmPred = lstmPred * sigma(powerIdx) + mu(powerIdx);
cnnLstmPred = cnnLstmPred * sigma(powerIdx) + mu(powerIdx);
cnnLstmAttPred = cnnLstmAttPred * sigma(powerIdx) + mu(powerIdx);
YTestActual = YTest * sigma(powerIdx) + mu(powerIdx);

% 评估指标计算
metrics = @(y, yhat) struct(...
    'RMSE', sqrt(mean((y - yhat).^2)), ...
    'MAE', mean(abs(y - yhat)), ...
    'MAPE', mean(abs((y - yhat)./y))*100, ...
    'R2', 1 - sum((y - yhat).^2) / sum((y - mean(y)).^2));

lstmMetrics = metrics(YTestActual, lstmPred);
cnnLstmMetrics = metrics(YTestActual, cnnLstmPred);
cnnLstmAttMetrics = metrics(YTestActual, cnnLstmAttPred);

%% 4. 结果可视化与对比
% 预测曲线对比
figure('Position', [100, 100, 1200, 600])
subplot(2,1,1)
plot(YTestActual, 'k', 'LineWidth', 2)
hold on
plot(lstmPred, 'b--')
plot(cnnLstmPred, 'r--')
plot(cnnLstmAttPred, 'g-')
title('光伏功率预测结果对比')
xlabel('时间步')
ylabel('功率 (kW)')
legend('真实值', 'LSTM', 'CNN-LSTM', 'CNN-LSTM-Attention')
grid on

% 残差对比
subplot(2,1,2)
plot(YTestActual - lstmPred, 'b')
hold on
plot(YTestActual - cnnLstmPred, 'r')
plot(YTestActual - cnnLstmAttPred, 'g')
title('预测残差对比')
xlabel('时间步')
ylabel('残差 (kW)')
legend('LSTM残差', 'CNN-LSTM残差', 'CNN-LSTM-Attention残差')
grid on

% 指标对比表
fprintf('模型性能对比:\n')
fprintf('模型\t\t\tRMSE(kW)\tMAE(kW)\t\tMAPE(%%)\t\tR²\n')
fprintf('LSTM\t\t%.2f\t\t%.2f\t\t%.2f\t\t%.4f\n', ...
    lstmMetrics.RMSE, lstmMetrics.MAE, lstmMetrics.MAPE, lstmMetrics.R2)
fprintf('CNN-LSTM\t%.2f\t\t%.2f\t\t%.2f\t\t%.4f\n', ...
    cnnLstmMetrics.RMSE, cnnLstmMetrics.MAE, cnnLstmMetrics.MAPE, cnnLstmMetrics.R2)
fprintf('CNN-LSTM-Attention\t%.2f\t\t%.2f\t\t%.2f\t\t%.4f\n', ...
    cnnLstmAttMetrics.RMSE, cnnLstmAttMetrics.MAE, cnnLstmAttMetrics.MAPE, cnnLstmAttMetrics.R2)

% 性能指标雷达图
figure
metricsTable = [lstmMetrics; cnnLstmMetrics; cnnLstmAttMetrics];
radarMetrics = [metricsTable.RMSE; metricsTable.MAE; metricsTable.MAPE; metricsTable.R2];
radarMetrics(1:3,:) = radarMetrics(1:3,:)/max(radarMetrics(1:3,:)); % 归一化
radarMetrics(4,:) = 1 - radarMetrics(4,:); % R²转换为误差

spider_plot(radarMetrics, ...
    'AxesLabels', {'RMSE', 'MAE', 'MAPE', '1-R²'}, ...
    'AxesInterval', 4, ...
    'AxesPrecision', 1, ...
    'FillOption', {'on', 'on', 'on'}, ...
    'FillTransparency', [0.1, 0.1, 0.1], ...
    'Color', [0 0.4470 0.7410; 0.8500 0.3250 0.0980; 0.4660 0.6740 0.1880])
legend('LSTM', 'CNN-LSTM', 'CNN-LSTM-Attention')
title('模型性能雷达图 (数值越小越好)')

%% 5. 自定义函数
function [X, Y] = createTimeSeriesData(data, lookback, horizon, targetIdx)
    numSteps = size(data, 1) - lookback - horizon + 1;
    X = zeros(numSteps, lookback, size(data,2));
    Y = zeros(numSteps, 1);
    
    for i = 1:numSteps
        X(i,:,:) = data(i:i+lookback-1, :);
        Y(i) = data(i+lookback+horizon-1, targetIdx);
    end
end

function layer = selfAttentionLayer(numFeatures, name)
% 自定义自注意力层
    arguments
        numFeatures
        name = ''
    end
    
    layer = functionLayer(@(X) selfAttention(X, numFeatures), ...
        'Formattable', true, ...
        'Name', name);
end

function Y = selfAttention(X, numFeatures)
% 自注意力机制实现
    [batchSize, seqLength, numChannels] = size(X);
    
    % 线性变换
    Wq = dlarray(randn(numChannels, numFeatures));
    Wk = dlarray(randn(numChannels, numFeatures));
    Wv = dlarray(randn(numChannels, numFeatures));
    
    Q = pagemtimes(X, Wq);
    K = pagemtimes(X, Wk);
    V = pagemtimes(X, Wv);
    
    % 注意力分数
    scores = pagemtimes(Q, 'transpose', K, 'none') / sqrt(numFeatures);
    attentionWeights = softmax(scores, 'DataFormat', 'SCB');
    
    % 上下文向量
    context = pagemtimes(attentionWeights, V);
    
    % 残差连接 + 层归一化
    Y = X + context;
    Y = layernorm(Y, 'DataFormat', 'SCB');
end

function plotMetricsComparison(metrics)
% 模型性能指标对比柱状图
    modelNames = {'LSTM', 'CNN-LSTM', 'CNN-LSTM-Attention'};
    metricNames = {'RMSE', 'MAE', 'MAPE', 'R2'};
    values = zeros(3,4);
    
    for i = 1:3
        values(i,1) = metrics(i).RMSE;
        values(i,2) = metrics(i).MAE;
        values(i,3) = metrics(i).MAPE;
        values(i,4) = metrics(i).R2;
    end
    
    figure('Position', [100, 100, 1000, 400])
    for j = 1:4
        subplot(1,4,j)
        bar(values(:,j))
        title(metricNames{j})
        set(gca, 'XTickLabel', modelNames)
        grid on
        
        % 添加数值标签
        yl = ylim;
        for k = 1:3
            text(k, values(k,j)+0.05*diff(yl), ...
                sprintf(j==4?'%.4f':'%.2f', values(k,j)), ...
                'HorizontalAlignment', 'center')
        end
    end
    sgtitle('模型性能指标对比')
end

关键功能说明：

数据处理模块：
- 自动标准化多变量时间序列数据
- 创建滑动窗口数据集（lookback机制）
- 7:1.5:1.5的标准数据划分
三模型架构：
- LSTM模型：纯LSTM结构，128个隐藏单元
- CNN-LSTM模型：
  - 2层1D卷积（64/128个滤波器）
  - 批归一化和ReLU激活
  - 最大池化层
  - LSTM层（128单元）
- CNN-LSTM-Attention模型：
  - CNN特征提取模块
  - LSTM时序建模层
  - 自定义自注意力机制层
  - 残差连接和层归一化
自定义注意力层：
- 实现QKV自注意力机制
- 支持批处理和序列处理
- 包含缩放点积注意力
- 残差连接和层归一化
评估与可视化：
- 四维评估指标：RMSE、MAE、MAPE、R²
- 预测结果对比曲线
- 残差分布分析
- 雷达图综合对比
- 柱状图指标量化展示

使用指南：

数据准备：
- 准备CSV格式数据，最后一列为光伏功率值
- 其他列为特征（温度、辐照度等）
- 加载数据：load('pv_data.mat')替换为实际数据
参数调整：
- lookback：历史时间窗口大小（建议24小时）
- forecastHorizon：预测步长（1小时）
- numFeatures：输入特征数量
- 训练参数：学习率、批量大小等
运行流程：
- 一键运行整个脚本
- 自动训练三个模型
- 生成对比结果和可视化图表
结果解读：
- 预测曲线：比较模型拟合效果
- 残差图：分析误差分布
- 指标表：量化模型性能
- 雷达图：综合对比模型优劣