EADST

2026年1月11日AI图片与视频领域最新成果盘点

2026年1月11日AI图片与视频领域最新成果盘点(含开源链接/入口)

发布日期:2026 年 1 月 11 日

本文总结近期 AI 在 视频生成、数字人、语音转录、可控视角/4D、机器人 等方向的进展,并给出对应的论文/开源仓库/工具入口,便于快速上手与检索。


一、核心成果汇总(图片与视频为主)

1)视频生成与编辑类模型

DreamID-V(字节跳动)——高保真视频级换脸模型


LTX-2(Lightricks)——音画同步视频生成模型


研究社区代表项目(可核对的开源条目)


2)数字人相关技术

Google Veo 3 / Veo 3.1 + Flow + Google Vids


HRM²Avatar(阿里)——移动端高保真数字人生成框架


3)其他关联 AI 成果(跨领域支持)

ElevenLabs Scribe v2 ——语音转录/字幕制作


DeepTutor(港大)——开源研究/学习辅助工具

  • 核心能力:上传资料后进行问答、学习辅助、研究工作流支持(具体功能以仓库版本为准)。
  • 资源链接:
  • DeepTutor GitHub

SleepFM(斯坦福)——睡眠与健康分析模型

  • 核心能力:健康/睡眠相关基础模型与分析能力(偏健康数据方向)。
  • 资源链接:
  • SleepFM GitHub

4)人形机器人与视觉技术关联

Boston Dynamics Atlas(新一代电驱 Atlas)


二、资源索引(文字版,无表格)

下面按“成果名称 → 类型 → 资源链接”列出,方便复制与二次整理:

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
CLAP CSV CAM 第一性原理 HuggingFace Tracking uwsgi GIT LoRA Website Conda PDF Random Django PDB Proxy Sklearn 公式 CEIR Transformers 继承 Anaconda YOLO git-lfs 强化学习 Quantize Base64 Rebuttal API Card Numpy Qwen2 QWEN Paddle FlashAttention 音频 Docker Bipartite llama.cpp Tiktoken BF16 Hotel 顶会 transformers TensorRT OpenAI 图形思考法 Knowledge 论文 递归学习法 Python VGG-16 PyTorch Pandas Use OCR SVR Magnet Nginx Plate TTS logger 多进程 DeepSeek CUDA Template 证件照 InvalidArgumentError hf GoogLeNet Quantization TSV git Review Permission JSON Disk HaggingFace OpenCV 版权 TensorFlow 域名 Breakpoint 搞笑 uWSGI FastAPI Datetime Jupyter Algorithm Qwen2.5 Ubuntu BTC MD5 SPIE Firewall Streamlit WAN Vmess Logo Baidu CTC GPTQ Plotly LaTeX Pillow Freesound DeepStream WebCrawler Pytorch Clash ONNX UI tar Diagram Safetensors icon NLTK Bin Agent Hungarian 论文速读 VSCode Input PyCharm COCO mmap Pickle 飞书 Github Food Shortcut 净利润 VPN AI Git Heatmap FP8 C++ Augmentation IndexTTS2 Vim 云服务器 Windows BeautifulSoup Qwen Distillation Interview ModelScope 阿里云 图标 SAM Math 腾讯云 Jetson Image2Text RAR Markdown Cloudreve LLAMA Bert tqdm Michelin 关于博主 Paper 报税 Land SQLite NLP Mixtral Color Dataset FP32 LLM ResNet-50 Attention NameSilo Miniforge LeetCode GGML v2ray Password RGB CC Video EXCEL Gemma Tensor diffusers Google Claude FP16 XGBoost scipy Statistics Web 签证 v0.dev Zip News FP64 Search Linux GPT4 多线程 Animate Ptyhon CV 财报 Data Bitcoin UNIX 算法题 ChatGPT XML Excel SQL PIP Domain printf Crawler torchinfo Hilton Llama Translation
站点统计

本站现有博文328篇,共被浏览841298

本站已经建立2546天!

热门文章
文章归档
回到顶部