Quick Review: Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMs| 东毅居士

Quick Review: Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMs

作者：XD / 发表： 2023年12月6日 23:51 / 更新： 2023年12月7日 00:55 / 科研学习 / 阅读量：1444

Optimize Weight Rounding via Signed Gradient Descent for the Quantization of Large Language Models

Paper: Optimize Weight Rounding on arXiv
Code: Intel Neural Compressor on GitHub
Organization: Intel

Key Feature:

Adaptive Weight Rounding: Utilizes backward optimization to dynamically adjust the quantized integer values, either rounding them up or down, to optimize the model's performance during quantization.

本文作者：XD 转载请标明出处：http://www.eadst.com/blog/224

本站采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

上一篇
Quick Review: Norm Tweaking: High-performance Low-bit Quantization of Large Language Models

下一篇
Quick Review: SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression

相关标签

LLM Quantization

About Me

XD

Goals determine what you are going to be.

Category

标签云

Ptyhon Cloudreve PIP Disk ModelScope 财报 Transformers 多线程 Proxy CEIR Windows Password Input SQL Logo Magnet Freesound XGBoost Git 搞笑 HaggingFace ONNX Permission Jetson Linux Docker Web Quantization Card PyTorch Algorithm Review Clash GPTQ Zip tqdm Hungarian scipy CV Shortcut Diagram Tracking 关于博主 Breakpoint Bipartite Pytorch Bin Michelin VSCode hf mmap Github 证件照 LoRA 报税 GoogLeNet RAR PDB logger Food API TTS Statistics Heatmap QWEN Random MD5 transformers FP64 llama.cpp tar VPN Mixtral InvalidArgumentError CLAP 版权 Math LaTeX Base64 Tensor XML Quantize Plate Anaconda GIT CC Conda Bitcoin DeepStream RGB 签证 LeetCode Interview Markdown 继承 torchinfo Hilton SVR Crawler CUDA ChatGPT Llama YOLO NLTK GPT4 FP32 Knowledge AI Land BTC LLM Image2Text Numpy 净利润 OCR TensorFlow Dataset JSON printf ResNet-50 FP8 Qwen2.5 uwsgi CTC Template WebCrawler SPIE DeepSeek Python NameSilo Gemma Augmentation Qwen GGML 飞书 Use 域名 v2ray Firewall HuggingFace Claude CAM Jupyter UI Website v0.dev PyCharm Excel Data Plotly 腾讯云 Pickle Vim Bert Pandas C++ Distillation CSV FP16 Paddle TSV Video git-lfs LLAMA Vmess 多进程 OpenCV SQLite PDF OpenAI Nginx Pillow 公式 Datetime TensorRT Color 算法题 Tiktoken diffusers Streamlit Safetensors Translation FlashAttention NLP FastAPI Sklearn Baidu git Django Qwen2 Hotel Ubuntu COCO Attention BeautifulSoup 音频 BF16 Paper UNIX uWSGI Google EXCEL VGG-16 Domain 阿里云

站点统计

本站现有博文304篇,共被浏览707341次

本站已经建立2327天!

热门文章

文章归档