LSTM 升级了? xLSTM 来挑战现状了

多年来,一种名为长短期记忆(LSTM)的神经网络一直是处理文本等序列数据的主要模型。LSTM 早在 20 世纪 90 年代就已问世,它善于记忆长程模式,避免了早期递归网络所面临的 "梯度消失" 技术问题。这使得 LSTM 在语言建模、文本生成、语音识别等所有语言任务中都具有难以置信的价值。在相当长的一段时间里,LSTM 看起来势不可挡。

阅读更多