EADST

2026年1月11日AI图片与视频领域最新成果盘点

2026年1月11日AI图片与视频领域最新成果盘点(含开源链接/入口)

发布日期:2026 年 1 月 11 日

本文总结近期 AI 在 视频生成、数字人、语音转录、可控视角/4D、机器人 等方向的进展,并给出对应的论文/开源仓库/工具入口,便于快速上手与检索。


一、核心成果汇总(图片与视频为主)

1)视频生成与编辑类模型

DreamID-V(字节跳动)——高保真视频级换脸模型


LTX-2(Lightricks)——音画同步视频生成模型


研究社区代表项目(可核对的开源条目)


2)数字人相关技术

Google Veo 3 / Veo 3.1 + Flow + Google Vids


HRM²Avatar(阿里)——移动端高保真数字人生成框架


3)其他关联 AI 成果(跨领域支持)

ElevenLabs Scribe v2 ——语音转录/字幕制作


DeepTutor(港大)——开源研究/学习辅助工具

  • 核心能力:上传资料后进行问答、学习辅助、研究工作流支持(具体功能以仓库版本为准)。
  • 资源链接:
  • DeepTutor GitHub

SleepFM(斯坦福)——睡眠与健康分析模型

  • 核心能力:健康/睡眠相关基础模型与分析能力(偏健康数据方向)。
  • 资源链接:
  • SleepFM GitHub

4)人形机器人与视觉技术关联

Boston Dynamics Atlas(新一代电驱 Atlas)


二、资源索引(文字版,无表格)

下面按“成果名称 → 类型 → 资源链接”列出,方便复制与二次整理:

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
diffusers Card Knowledge WebCrawler Diagram SVR Input Excel Pandas EXCEL 腾讯云 Github 版权 printf AI Michelin 图标 Vmess Django Google BTC Search Disk HuggingFace LaTeX 多进程 关于博主 FP8 v0.dev 继承 InvalidArgumentError ONNX icon Distillation UI 递归学习法 图形思考法 v2ray 报税 音频 GIT 证件照 Markdown Freesound Vim RAR Algorithm Logo Hotel ResNet-50 Tracking Tiktoken Baidu CUDA Interview Paddle Food Tensor TensorFlow GPT4 FP16 GGML API Proxy BF16 Transformers Numpy Land 论文 OpenAI CTC GoogLeNet Attention LoRA Git MD5 LeetCode TSV Plate Pillow DeepStream Domain git Datetime Llama Password JSON OpenCV Math CV Streamlit Qwen2 LLM Claude torchinfo PyTorch Bert SQL COCO Sklearn LLAMA Base64 mmap 域名 Pickle VGG-16 Bin ms-swift 搞笑 PyCharm Mixtral uwsgi GPTQ Paper 阿里云 Pytorch Hungarian OCR TTS Shortcut Linux XML 财报 Translation Image2Text SQLite Jetson C++ CEIR hf Rebuttal Safetensors Firewall Qwen uWSGI logger HaggingFace FP32 Cloudreve Dataset 顶会 Color VSCode VPN 多线程 Video NLP CC Ubuntu Quantization Use Animate Crawler 签证 Nginx Statistics UNIX Bipartite 公式 Windows PDF Web Random Docker QWEN 强化学习 RGB DeepSeek CSV BeautifulSoup 算法题 FP64 Miniforge PDB TensorRT git-lfs Zip Heatmap Python 净利润 News FastAPI Bitcoin XGBoost Conda 飞书 Review ModelScope transformers Hilton tar 论文速读 CLAP llama.cpp PIP IndexTTS2 Anaconda Template Data Gemma Permission Breakpoint Jupyter scipy Magnet tqdm Ptyhon Agent WAN NameSilo ChatGPT SPIE NLTK Qwen2.5 Augmentation FlashAttention CAM 云服务器 Plotly Quantize YOLO SAM Clash 第一性原理 Website
站点统计

本站现有博文329篇,共被浏览859486

本站已经建立2568天!

热门文章
文章归档
回到顶部