"MIND"検索結果

Mind Lab LoRA 研究:0.12% のパラメータ増分で AI 記憶が 1.31 倍に向上

6月2日付の報道によると、Mindverse(Mindverse)傘下のMind Labは、LoRAおよびPEFTの高効率微調に関する研究成果をこのところ連続して発表している。δ-memの主要指標は、パラメータ増分を0.12%まで低く抑えつつ、Memory Agent BenchおよびLoCoMoの重度記憶基準テストでそれぞれ1.31倍、1.20倍の性能向上をもたらす点だ。 δ-mem:確認された技術メカニズムとベンチマーク数値 δ-memは、LoRAの特性に合わせて設計された並列混合型のリニア注意(linear attention)アーキテクチャである。従来のTransformerにおけるKVキャッシュは推論中に凍結されたキャッシュであり、そもそも更新能力を持たない。δ-memは「オンラインの連想メモリ状態」(Online State of Associative Memory)を導入し、8×8の行列を維持する。token入力の過程で増分ルール(delta-rule learning)により継続的に更新され、生成時にはバックボーンネットワークのAttention QueryとOutp
MarketWhisper·06-04 02:35
news-image