模型 - 第99页|程序员档案馆

【SSL-RL】自监督强化学习：引导式潜在预测表征 (BLR)算法

📢本篇文章是博主强化学习（RL）领域学习时，用于个人学习、研究或者欣赏使用，并基于博主对相关等地方的一些理解而记录的学习摘录和笔记，...

Bloger 09-02 0 751 技术文档

主要参考：https://github.com/jpata/gym-so100/tree/integration/gym_so100/assets/trs_so_arm100 参考：（八）lerobot开源项目扩展so100的仿真操控（操作...

Bloger 09-02 0 152 技术文档

AI与高级辅助驾驶的时代浪潮人工智能正在重塑现代交通的面貌，而高级辅助驾驶技术无疑是这场变革中最具颠覆性的力量之一。作为全球AI计算的领军企业，NVIDI...

Bloger 09-02 0 623 技术文档

对于没有基础的研究生而言，计算机视觉（CV）的学习需系统规划，分阶段推进。以下是结合数学、编程、理论、实践的完整路线：真的感谢曾经的自己刷完这份人...

Bloger 09-02 0 780 技术文档

目的： C++项目中接入Sherpa-onnx实现文字转语音功能开发环境 Windows、VS2022 步骤： 1.创建C++空项目，位置放到合适的地方即可。 2.下载Sherpa-onnx动态...

Bloger 09-02 0 668 技术文档

$视频生成Sora的全面解析：从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等_vivit的时空编码与dit的扩散$

前言真没想到，距离视频生成上一轮的集中爆发(详见《Sora之前的视频生成发展史：从Gen2、Emu Video到PixelDance、SVD、Pika 1.0》)才过去三个月，没想OpenA...

Bloger 09-02 0 684 技术文档

最近，OpenAI 团队的 GPT-4o 模型，在多模态方面的能力有了大幅提升，这次我们就使用 GPT-4o 完成一个视频理解的实战。 1. 环境搭建 1.1 安装 FFmpeg 做视...

Bloger 09-02 0 432 技术文档

【算法介绍】在C++中使用纯OpenCV部署YOLOv11-seg进行实例分割是一项具有挑战性的任务，因为YOLOv11通常是用PyTorch等深度学习框架实现的，而OpenCV本身并...

Bloger 09-02 0 598 技术文档

在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达 20% 以上，泛化能力不足成为...

Bloger 09-02 0 613 技术文档

本文记录了我在学习 llama-factory过程中对代码运行过程的梳理代码入口——src/train.py from llamafactory.train.tuner import run_expdef main(): run_exp(...

Bloger 09-02 0 186 技术文档