基于长短神经网络LSTM做多特征输入单输出的二分类及多分类模型。 程序内注释详细,直接替换数据就可以用。 程序语言为matlab。 程序可出分类效果图,迭代优化图,混淆矩阵图具体效果如下所示。
在机器学习领域,长短时记忆网络(LSTM)凭借其处理序列数据的独特优势,在众多分类任务中崭露头角。今天咱们就来聊聊如何用Matlab基于LSTM搭建多特征输入单输出的二分类及多分类模型。
数据准备
假设我们的数据已经整理好了,存放在一个表格文件里,每一行是一个样本,不同列对应不同特征,最后一列是类别标签。Matlab里读取表格数据很方便,比如:
data = readtable('your_data_file.csv'); % 假设数据存为CSV文件 features = table2array(data(:,1:end - 1)); % 提取特征 labels = table2array(data(:,end)); % 提取标签这段代码中,readtable函数用于读取表格数据,table2array函数将表格数据转换为便于后续处理的数组形式。我们把除最后一列之外的数据当作特征,最后一列当作类别标签。
二分类模型构建
数据预处理
对于二分类,标签通常需要转换为0和1的形式。假设原始标签是类别名称,我们可以这样转换:
% 假设原始标签有两个类别,分别是'A'和'B' unique_labels = unique(labels); new_labels = zeros(size(labels)); for i = 1:length(unique_labels) new_labels(strcmp(labels,unique_labels{i})) = i - 1; end这里遍历唯一的类别标签,将其转换为0和1的形式。这样处理后的数据才能更好地用于二分类LSTM模型。
LSTM模型搭建
numFeatures = size(features,2); % 特征数量 numHiddenUnits = 100; % 隐藏单元数量 layers = [... sequenceInputLayer(numFeatures) % 序列输入层 lstmLayer(numHiddenUnits) % LSTM层 fullyConnectedLayer(1) % 全连接层 sigmoidLayer % 激活函数层,适用于二分类 classificationLayer]; % 分类层sequenceInputLayer接受多特征输入,lstmLayer是核心的长短时记忆层,fullyConnectedLayer将LSTM层的输出连接到最终的预测节点,sigmoidLayer将输出值映射到0 - 1之间,适合二分类概率输出,最后classificationLayer完成分类任务。
模型训练与评估
options = trainingOptions('adam',... 'MaxEpochs',100,... 'InitialLearnRate',0.001,... 'ValidationData',{features,new_labels},... 'ValidationFrequency',10,... 'Verbose',false,... 'Plots','training-progress'); net = trainNetwork(features,new_labels,layers,options);trainingOptions设置了训练的超参数,像优化器用adam,最大训练轮数100,初始学习率0.001等。trainNetwork函数开始训练模型。训练结束后,我们可以绘制分类效果图、迭代优化图和混淆矩阵图。
% 预测 predictions = classify(net,features); % 绘制分类效果图 figure; gscatter(features(:,1),features(:,2),predictions); title('二分类效果图'); xlabel('特征1'); ylabel('特征2'); % 绘制迭代优化图 figure; plot(options.TrainingHistory.Loss); title('迭代优化图'); xlabel('Epoch'); ylabel('Loss'); % 绘制混淆矩阵图 confusionmat(new_labels,predictions); figure; cm = confusionmat(new_labels,predictions); confusionchart(cm); title('混淆矩阵图');classify函数用于预测类别。分类效果图通过gscatter函数绘制,展示不同类别在特征空间的分布;迭代优化图展示训练过程中损失函数的变化;混淆矩阵图用confusionmat和confusionchart绘制,直观反映分类的准确情况。
多分类模型构建
多分类和二分类在一些地方有区别。比如激活函数层和数据预处理。
数据预处理
多分类的标签处理稍有不同,假设原始标签是1,2,3...这样的类别编号,我们不需要像二分类那样特殊转换,但可能需要进行独热编码。
numClasses = numel(unique(labels)); oneHotLabels = dummyvar(labels);dummyvar函数将类别标签转换为独热编码形式,这在多分类中很常用。
LSTM模型搭建
numFeatures = size(features,2); % 特征数量 numHiddenUnits = 100; % 隐藏单元数量 layers = [... sequenceInputLayer(numFeatures) % 序列输入层 lstmLayer(numHiddenUnits) % LSTM层 fullyConnectedLayer(numClasses) % 全连接层,输出节点数为类别数 softmaxLayer % 激活函数层,适用于多分类 classificationLayer]; % 分类层这里的区别在于全连接层的输出节点数是类别数,激活函数层使用softmaxLayer,它能将输出转换为各类别的概率分布。
模型训练与评估
训练过程和二分类类似,只是数据用了独热编码后的标签。
options = trainingOptions('adam',... 'MaxEpochs',100,... 'InitialLearnRate',0.001,... 'ValidationData',{features,oneHotLabels},... 'ValidationFrequency',10,... 'Verbose',false,... 'Plots','training-progress'); net = trainNetwork(features,oneHotLabels,layers,options);评估过程和二分类类似,只是预测和绘制混淆矩阵稍有不同。
% 预测 predictions = classify(net,features); % 绘制混淆矩阵图 confusionmat(labels,predictions); figure; cm = confusionmat(labels,predictions); confusionchart(cm); title('多分类混淆矩阵图');通过上述步骤,我们就实现了基于LSTM的多特征输入单输出的二分类及多分类模型,并且能通过Matlab代码直接替换数据就使用,同时还能输出直观的效果图来评估模型性能。希望对大家在相关领域的研究和实践有所帮助。