EADST

2026年1月11日AI图片与视频领域最新成果盘点

2026年1月11日AI图片与视频领域最新成果盘点(含开源链接/入口)

发布日期:2026 年 1 月 11 日

本文总结近期 AI 在 视频生成、数字人、语音转录、可控视角/4D、机器人 等方向的进展,并给出对应的论文/开源仓库/工具入口,便于快速上手与检索。


一、核心成果汇总(图片与视频为主)

1)视频生成与编辑类模型

DreamID-V(字节跳动)——高保真视频级换脸模型


LTX-2(Lightricks)——音画同步视频生成模型


研究社区代表项目(可核对的开源条目)


2)数字人相关技术

Google Veo 3 / Veo 3.1 + Flow + Google Vids


HRM²Avatar(阿里)——移动端高保真数字人生成框架


3)其他关联 AI 成果(跨领域支持)

ElevenLabs Scribe v2 ——语音转录/字幕制作


DeepTutor(港大)——开源研究/学习辅助工具

  • 核心能力:上传资料后进行问答、学习辅助、研究工作流支持(具体功能以仓库版本为准)。
  • 资源链接:
  • DeepTutor GitHub

SleepFM(斯坦福)——睡眠与健康分析模型

  • 核心能力:健康/睡眠相关基础模型与分析能力(偏健康数据方向)。
  • 资源链接:
  • SleepFM GitHub

4)人形机器人与视觉技术关联

Boston Dynamics Atlas(新一代电驱 Atlas)


二、资源索引(文字版,无表格)

下面按“成果名称 → 类型 → 资源链接”列出,方便复制与二次整理:

相关标签
About Me
XD
Goals determine what you are going to be.
Category
标签云
XML tar Freesound 强化学习 git Github VSCode Land TTS ModelScope PyCharm v2ray Baidu GPT4 OpenCV Data Animate Plate Linux 关于博主 报税 EXCEL CUDA Breakpoint Tensor LeetCode 净利润 FastAPI Qwen GoogLeNet Pandas LLAMA Disk 域名 DeepStream Transformers Input 继承 Paper Excel Tiktoken icon FP32 Docker Pytorch Distillation 图形思考法 Cloudreve Ubuntu Qwen2.5 LaTeX Jetson InvalidArgumentError IndexTTS2 SQLite Google BeautifulSoup Shortcut WebCrawler Mixtral 云服务器 Search git-lfs tqdm BF16 搞笑 Rebuttal WAN scipy Domain PyTorch Quantize CAM Bitcoin Tracking TensorFlow Nginx BTC CTC FP64 Bin Color printf GIT CV SVR HuggingFace Anaconda TSV SPIE CC Attention UI Numpy Random transformers Hotel Django Food AI OCR HaggingFace diffusers 第一性原理 Heatmap TensorRT Firewall 论文 CEIR API Plotly 公式 Dataset C++ COCO Card Git Image2Text Math torchinfo FP8 ResNet-50 GPTQ NLTK Michelin Proxy Clash uwsgi Quantization Llama 阿里云 RAR Gemma PDB Diagram Qwen2 Magnet 算法题 FP16 VGG-16 UNIX Website LLM 顶会 多进程 Sklearn Permission uWSGI Ptyhon Review ONNX PDF CLAP Augmentation JSON RGB Miniforge 音频 Streamlit ChatGPT logger DeepSeek hf Python QWEN Datetime Knowledge Windows LoRA 图标 Bipartite Hilton Password Crawler OpenAI Markdown CSV Vmess Conda Template Logo 证件照 Use YOLO Agent Statistics Paddle NLP News XGBoost Pillow SAM PIP Web mmap Video FlashAttention 财报 SQL v0.dev Vim 飞书 Pickle 腾讯云 NameSilo Base64 Algorithm Translation 版权 Hungarian MD5 论文速读 Interview 递归学习法 Bert Claude VPN llama.cpp 多线程 GGML 签证 Safetensors Jupyter Zip
站点统计

本站现有博文327篇,共被浏览833075

本站已经建立2538天!

热门文章
文章归档
回到顶部