EADST

2026年1月11日AI图片与视频领域最新成果盘点

2026年1月11日AI图片与视频领域最新成果盘点(含开源链接/入口)

发布日期:2026 年 1 月 11 日

本文总结近期 AI 在 视频生成、数字人、语音转录、可控视角/4D、机器人 等方向的进展,并给出对应的论文/开源仓库/工具入口,便于快速上手与检索。


一、核心成果汇总(图片与视频为主)

1)视频生成与编辑类模型

DreamID-V(字节跳动)——高保真视频级换脸模型


LTX-2(Lightricks)——音画同步视频生成模型


研究社区代表项目(可核对的开源条目)


2)数字人相关技术

Google Veo 3 / Veo 3.1 + Flow + Google Vids


HRM²Avatar(阿里)——移动端高保真数字人生成框架


3)其他关联 AI 成果(跨领域支持)

ElevenLabs Scribe v2 ——语音转录/字幕制作


DeepTutor(港大)——开源研究/学习辅助工具

  • 核心能力:上传资料后进行问答、学习辅助、研究工作流支持(具体功能以仓库版本为准)。
  • 资源链接:
  • DeepTutor GitHub

SleepFM(斯坦福)——睡眠与健康分析模型

  • 核心能力:健康/睡眠相关基础模型与分析能力(偏健康数据方向)。
  • 资源链接:
  • SleepFM GitHub

4)人形机器人与视觉技术关联

Boston Dynamics Atlas(新一代电驱 Atlas)


二、资源索引(文字版,无表格)

下面按“成果名称 → 类型 → 资源链接”列出,方便复制与二次整理:

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
Quantization hf Cloudreve Use FastAPI Translation Magnet Image2Text Crawler FP16 Linux v2ray Bipartite FP32 FlashAttention Video BTC 第一性原理 logger Diagram HaggingFace MD5 Math Web Miniforge CC ModelScope Password CAM Agent 公式 printf Transformers Pickle Interview tar RGB llama.cpp scipy 签证 Vmess Bert ChatGPT 多线程 Qwen2 Bitcoin Paddle Augmentation LLM 域名 Plate CUDA LLAMA OCR git IndexTTS2 CTC Markdown FP8 COCO 多进程 Pillow 飞书 SAM OpenCV 腾讯云 tqdm GGML WAN OpenAI 报税 Vim TTS Python GIT 图形思考法 版权 Claude 递归学习法 Dataset LeetCode diffusers Git Hilton PDB PDF Firewall 算法题 Conda Clash QWEN Attention RAR Knowledge icon Ubuntu CV Hotel Pytorch uwsgi VPN Paper WebCrawler API Anaconda PyTorch GoogLeNet EXCEL Qwen git-lfs Streamlit BF16 Gemma GPT4 Heatmap Proxy 顶会 Rebuttal Google Sklearn Input 财报 C++ Search Tiktoken Breakpoint LoRA Animate Template 关于博主 Qwen2.5 Plotly VGG-16 证件照 SVR Michelin TensorRT ONNX SQL Land transformers Zip Domain Ptyhon uWSGI Review Permission mmap TSV torchinfo Food v0.dev VSCode DeepStream Nginx Llama 搞笑 Logo Tracking Mixtral YOLO Website 净利润 Numpy Shortcut Disk Base64 Docker Baidu JSON NameSilo BeautifulSoup 音频 NLP Algorithm 继承 FP64 Windows Quantize 强化学习 Django NLTK Excel Github DeepSeek Tensor CEIR Bin SQLite Data News Jetson Random PyCharm SPIE PIP Distillation Freesound XML AI Hungarian UI GPTQ Pandas XGBoost Jupyter InvalidArgumentError 图标 CSV ResNet-50 TensorFlow CLAP 阿里云 LaTeX UNIX Safetensors HuggingFace Datetime Card Statistics 云服务器 Color
站点统计

本站现有博文324篇,共被浏览821261

本站已经建立2526天!

热门文章
文章归档
回到顶部