A smart SRAM macro architecture that computes attention scores directly from quantized KV cache indices, eliminating the dequantization step entirely. This approach significantly reduces per-query multiply operations compared to conventional KV cache designs.
量子化KVキャッシュによるハードウェアアクセラレーテッドアテンション
量子化KVキャッシュのルックアップインデックスからアテンションスコアを直接算出するスマートSRAMマクロアーキテクチャです。逆量子化プロセスを完全に不要とし、従来のKVキャッシュ設計と比較してクエリあたりの乗算回数を大幅に低減します。
あなたのアイデアは、世界を変えられるだろうか?
エネルギー問題、医療の未来、持続可能な社会——
どれも解決の鍵は「アイデア」にあります。
しかし、従来の発想法では限界があります。
だからこそ、私たちはAIで『発想の壁』を超えようと挑み続けています。
・AXELIDEA Patent:特許から新しい発明の扉を開く
・AXELIDEA Physical AI:物理世界に、知性を宿す
・AXELIDEA MI:材料開発を加速させ、未来の技術を創る
世界を動かすのは、AIとあなたの共創から生まれるアイデアです。
誰よりも早く的確に AIを使いこなすことが求められています。
Axelidea株式会社 (”アクセリディア”)
代表取締役・博士(工学)・弁理士 西田 泰士