【论文笔记】AWQ

• 文章名称:AWQ:Activation-aware Weight Quantization for LLM Compression and Acceleration
• 发表会议/年份:MLSys 2024
• 作者:Ji Lin, Jiaming Tang, Haotian Tang, Shang Yang
• 单位:MIT, SJTU, NVIDIA, Tsinghua MIT-IBM, UMass

LLM

本站由 @anonymity 使用 Stellar 主题创建。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。