Dr. Adrian M. Thorne. “Optimizing Large‑Scale Language Model Inference via Firmware‑Level and Architectural Attention Sparsity”. International Journal of Modern Medicine, vol. 4, no. 10, Oct. 2025, pp. 14-20, https://intjmm.com/index.php/ijmm/article/view/78.