LSTM,全称长短时记忆网络,是一种特殊的循环神经网络,专门设计用来解决传统RNN在处理长序列时遇到的梯度消失/爆炸问题。它的核心特点与优势是能够学习并记住数百步之前的输入信息、通过精密的门控系统控制信息的流动、有效缓解了训练过程中的梯度问题。在趣宽数学软件中,通过机器学习中的“长短时记忆网络”来创建该算法的模型。在创建模型时,通过调整词向量维度、隐藏层维度、输出维度和输入序列长度等参数来创建全新的模型实例。在这个例子中,我们创建一个全连接层作为LSTM的输出层。在添加样本时,系统会自动分词并建立训练用的词嵌入矩阵,通过调整学习率和迭代次数可以使得损失收敛到最佳状态。在预测时,输入要预测的句子就可以返回该句子所属类型的概率。
LSTM - 长短时记忆网络
详细请访问: https://www.qkcalc.com