之前发布过一篇讲解Diffusion Policy 的blog文章,近期看到越来越多基于这个工作的衍生论文都表现出不错的效果(当然都还不稳定),不过做一些固定的任务可...
前言 本文一开始是属于此文《UMI——斯坦福刷盘机器人:从手持夹持器到动作预测Diffusion Policy(含代码解读)》的第三部分,考虑后Diffusion Policy的重要性很...
前言 就在昨天3.19日的凌晨,英伟达发布的GR00T N1还是很有含金量的(上午已有好几个朋友私我了),由此可以看到很多相关工作的影子,比如helix π0 LAPA,具体...
代码:https://github.com/OpenDriveLab/UniVLA 相关论文:https://arxiv.org/pdf/2505.06111 0. 简介 如何让机器人在各种环境中高效工作是当前AI领域的重...
系列篇章💥 No. 文章 1 【GitHub开源AI精选】LLM 驱动的影视解说工具:Narrato AI 一站式高效创作实践 2 【GitHub开源AI精选】德国比勒费尔德大学...
📢本篇文章是博主强化学习(RL)领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等地方的一些理解而记录的学习摘录和笔记,...
前言 过去的半个多月 对于大模型 deepseek火爆全球,我对其的解读也写成了整整一个系列 详见《火爆全球的DeepSeek系列模型》,涉及对GRPO、MLA、V3、R1的详...
在AI应用开发中,如何让智能体与外部环境进行有效交互是一个关键问题。MetaGPT环境系统提供了一个强大的框架,使开发者能够轻松地将AI智能体与各种外部环境...
📢本篇文章是博主强化学习(RL)领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等地方的一些理解而记录的学习摘录和笔记,...
前言 过去2年多的深入超过此前7年,全靠夜以继日的勤奋,一天当两天用,抠论文 抠代码 和大模型及具身同事讨论,是目前日常 而具身库里,idp3、π0、lerobot...