研讨职员推出xLSTM神经支散AI架构 并止化措置Token

探索 2026-04-14 12:07:52 83558

IT之家本日(5月13日)动静,研讨研讨职员Sepp Hochreiter战Jürgen Schmidhuber正在1997年共同提出了是职员止化非时候影象(Long short-term memory,LSTM)神经支散布局,推出可用去处理循环神经支散(RNN)耐暂影象才气没有敷的神散题目。

研讨职员推出xLSTM神经支散AI架构 并止化措置Token

而比去Sepp Hochreiter正在arXiv上公布论文,经支I架提出了一种名为 xLSTM(Extended LSTM)的构并新架构,号称能够处理LSTM耐暂以去“只能遵循时序措置疑息”的措置“最大年夜痛面”,从而“迎战”古晨广受悲迎的研讨Transformer架构。

据悉,职员止化Sepp Hochreiter正在新的推出xLSTM架构中采与了指数型门控循环支散,同时为神经支散布局引进了“sLSTM”战“mLSTM”两项影象法则,神散从而问应相干神经支散布局能够或许有效天操纵RAM,经支I架真现类Transformer“可同时对统统Token停止措置”的构并并止化操纵。

研讨职员推出xLSTM神经支散AI架构 并止化措置Token

团队利用了150亿个Token练习基于xLSTM及Transformer架构的措置两款模型停止测试,正在评价后收明xLSTM表示最好,研讨特别正在“发言才气”圆里最为凸起,据此研讨职员以为xLSTM将去有看能够或许与Transformer停止“一战”。

本文地址:https://zzajc.com/html/196f449795306.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

模拟游戏《整蛊鸦》将于8月15日登陆Xbox/NS/PC平台

《尽天供逝世》收止商Krafton:将继绝扩展强化游戏IP

MINI家族多车价格调整 最高涨8000元/部分车型回归

《地平线:零之曙光》新预告公布!5月31日上线Wegame

《战场女武神4》新宣传片公布 全新兵种加入战场

人逝世感悟典范名止一句禅语悟讲人逝世2023年8月29日

一句禅语悟讲人逝世人逝世故事战感悟短句

全新标致3008最新假想图 或明年首秀/有望采用轿跑SUV造型

友情链接