动作 - 第4页|程序员档案馆

重讲Diffusion Policy(从公式和代码角度): 个人最看好的机器人操控算法_diffusion policy代码

之前发布过一篇讲解Diffusion Policy 的blog文章，近期看到越来越多基于这个工作的衍生论文都表现出不错的效果（当然都还不稳定），不过做一些固定的任务可...

Bloger 07-30 0 329 技术文档

前言本文一开始是属于此文《UMI——斯坦福刷盘机器人：从手持夹持器到动作预测Diffusion Policy(含代码解读)》的第三部分，考虑后Diffusion Policy的重要性很...

Bloger 07-30 0 362 技术文档

前言就在昨天3.19日的凌晨，英伟达发布的GR00T N1还是很有含金量的(上午已有好几个朋友私我了)，由此可以看到很多相关工作的影子，比如helix π0 LAPA，具体...

Bloger 07-30 0 72 技术文档

代码：https://github.com/OpenDriveLab/UniVLA 相关论文：https://arxiv.org/pdf/2505.06111 0. 简介如何让机器人在各种环境中高效工作是当前AI领域的重...

Bloger 07-30 0 561 技术文档

系列篇章💥 No. 文章 1 【GitHub开源AI精选】LLM 驱动的影视解说工具：Narrato AI 一站式高效创作实践 2 【GitHub开源AI精选】德国比勒费尔德大学...

Bloger 07-30 0 162 技术文档

$【强化学习】双延迟深度确定性策略梯度算法(TD3)详解_td3算法$

📢本篇文章是博主强化学习（RL）领域学习时，用于个人学习、研究或者欣赏使用，并基于博主对相关等地方的一些理解而记录的学习摘录和笔记，...

Bloger 07-30 0 40 技术文档

前言过去的半个多月对于大模型 deepseek火爆全球，我对其的解读也写成了整整一个系列详见《火爆全球的DeepSeek系列模型》，涉及对GRPO、MLA、V3、R1的详...

Bloger 07-30 0 518 技术文档

在AI应用开发中，如何让智能体与外部环境进行有效交互是一个关键问题。MetaGPT环境系统提供了一个强大的框架，使开发者能够轻松地将AI智能体与各种外部环境...

Bloger 07-30 0 913 技术文档

📢本篇文章是博主强化学习（RL）领域学习时，用于个人学习、研究或者欣赏使用，并基于博主对相关等地方的一些理解而记录的学习摘录和笔记，...

Bloger 07-30 0 742 技术文档

$LeRobot DP——LeRobot对动作策略Diffusion Policy的封装与解读(含DexCap库中对diffusion_policy的封装与实现)$

前言过去2年多的深入超过此前7年，全靠夜以继日的勤奋，一天当两天用，抠论文抠代码和大模型及具身同事讨论，是目前日常而具身库里，idp3、π0、lerobot...

Bloger 07-30 0 37 技术文档