一套基本“能用”的Search架构 -- Advanced Search System
作者:XD / 发表: 2026年1月5日 06:22 / 科研学习/ 阅读量:2
Search从来不是一个向量接口,而是一个长期演进的生产系统Advanced Search System。
Search从来不是一个向量接口,而是一个长期演进的生产系统Advanced Search System。
🔥 Self-Evolving AI Agents:自我进化智能体研究全景综述
SAM 3:从 Prompt 到通用分割 — 一个技术/算法深度解析
WAN 2.2-Animate 技术原理解析
IndexTTS-2:零样本情绪控制与时长可控的下一代语音合成
CLAP 模型的结构 文本输入 → 文本编码器 → 投影层 → 共享语义空间 音频输入 → 音频编码器 → 投影层 → 共享语义空间
gemma-3n-E4B-it 框架图
gemma-3n-E4B-it配置文件config.json解析
在 AI 模型越来越庞大的今天,我们面临的不仅是算力挑战,更有带宽、能耗和模型部署的瓶颈。正因如此,更高效的数值表示方式成为突破口,其中最受关注的就是 FP8(8位浮点数)格式。
Understanding FP32 and FP64: Single and Double Precision Floating Point
Understanding BF16: Brain Floating Point Format
Understanding FP16: Half-Precision Floating Point
Lucid Plugin from ChatGPT to Creating the Diagram
SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models
Paper: https://arxiv.org/abs/2211.10438
Code: https://github.com/mit-han-lab/smoothquant
Organization: MIT
AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration
Paper: https://arxiv.org/abs/2306.00978
Code: https://github.com/mit-han-lab/llm-awq/
Organization: MIT
ZeroQuant-FP: A Leap Forward in LLMs Post-Training W4A8 Quantization Using Floating-Point Formats
Paper: https://arxiv.org/abs/2307.09782
Code: https://github.com/microsoft/DeepSpeed
Organization: Microsoft