Quick Review: ZeroQuant-FP| 东毅居士

Quick Review: ZeroQuant-FP

作者：XD / 发表： 2023年12月7日 00:32 / 更新： 2023年12月7日 00:56 / 科研学习 / 阅读量：2308

ZeroQuant-FP: A Leap Forward in LLMs Post-Training W4A8 Quantization Using Floating-Point Formats

Paper: ZeroQuant-FP on arXiv
Code: ZeroQuant-FP on GitHub
Organization: Microsoft

Highlights:

FP4 Weight Quantization: Implements 4-bit floating-point (FP4) quantization for model weights.
FP8 Activation Quantization: Utilizes 8-bit floating-point (FP8) quantization for activations, optimizing the balance between performance and precision.

本文作者：XD 转载请标明出处：http://www.eadst.com/blog/227

本站采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

上一篇
Quick Review: QUIK: Towards End-to-end 4-Bit Inference on Generative Large Language Models

下一篇
Quick Review: AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration

相关标签

LLM Quantization

About Me

XD

Goals determine what you are going to be.

Category

标签云

Rebuttal Nginx CC Pytorch NLTK PDB v0.dev 音频 NameSilo SVR C++ 论文速读 Plotly Color Freesound Dataset GIT 顶会算法题 LeetCode TSV Search Augmentation llama.cpp Math Use SQLite Qwen2.5 VGG-16 Ubuntu GPT4 Mixtral 阿里云 News Hungarian git-lfs WAN Safetensors QWEN SPIE Paper git ResNet-50 Logo Docker Quantize Disk 报税 DeepSeek v2ray Zip LLAMA 论文 Linux EXCEL Qwen2 VSCode Bipartite FP8 Base64 Cloudreve scipy Interview Domain Input TensorRT IndexTTS2 Bitcoin 飞书 Agent RGB Vim Pandas BF16 Quantization uWSGI hf printf Algorithm 多进程 Translation Sklearn Python Pillow Claude ChatGPT ModelScope Qwen Hilton Video BeautifulSoup 第一性原理 Streamlit RL Proxy InvalidArgumentError JSON CUDA PIP Website Animate OpenCV Breakpoint FastAPI API Data FlashAttention Password Llama SAM Random Transformers LLM CLAP 多线程 LoRA OCR Numpy Baidu FP32 Template 公式 tqdm 图形思考法关于博主 UI torchinfo Food YOLO AI Tensor Ptyhon transformers CTC WebCrawler BTC HaggingFace diffusers Google 腾讯云 Tiktoken 签证 Review Statistics OpenAI Heatmap uwsgi CV MD5 Pickle Django VPN Vmess GGML Git 强化学习 NLP FP64 Miniforge PyTorch Windows CSV ms-swift Conda 继承财报 Tracking Paddle Bert CAM Jetson Anaconda 递归学习法 Gemma Excel Hotel tar Michelin LaTeX PDF Clash 图标 HuggingFace Magnet RAR 云服务器 COCO Github CEIR ONNX Shortcut 搞笑 Crawler Distillation Plate 域名 XML 证件照 Card FP16 版权 Diagram PyCharm Image2Text TensorFlow logger Bin Markdown Datetime Firewall XGBoost DeepStream Web Permission SQL GPTQ TTS Knowledge icon mmap Land 净利润 GoogLeNet Jupyter UNIX Attention

站点统计

本站现有博文332篇,共被浏览878855次

本站已经建立2585天!

热门文章

文章归档