显存 - 第3页|程序员档案馆

学AI需要什么样的电脑配置？（机器学习丨深度学习丨计算机视觉丨自然语言处理）_机器学习电脑花销

引言：AI学习——硬件是基石，配置是起点当你准备踏入AI的“炼丹炉”，一台合适的电脑就不可或缺。无论是处理海量数据的预处理，还是训练动辄数十亿参数的大模...

Bloger 08-15 0 17 技术文档

本地部署大模型是AI从业者的核心技能之一，既能保障数据隐私，又能实现定制化需求。但面对复杂的硬件配置、性能瓶颈和安全隐患，新手如何高效避坑？本文结合...

Bloger 08-08 0 537 技术文档

以下是使用llama.cpp 部署DeepSeek模型的完整指南一、环境准备安装llama.cpp 克隆仓库并编译： git clone https://github.com/ggerganov/llama.cpp cd l...

Bloger 08-08 0 547 技术文档

文章目录正常导入Llama 使用modelscope下载使用transformers导入 24GB显存导入拓展正常导入Llama 正常情况下，使用如下代码导入meta-llama/Ll...

Bloger 08-08 0 557 技术文档

DeepSpeed 是由微软开发的开源深度学习优化框架，专为超大规模模型训练与推理设计，通过显存优化、并行策略和通信加速等核心技术，显著提升训练效率并降低资...

Bloger 08-08 0 525 技术文档

引言随着大语言模型（LLM）参数规模突破千亿级，基于人类反馈的强化学习（RLHF）成为提升模型对齐能力的关键技术。OpenRLHF、verl、LLaMA-Factory和SWIFT作...

Bloger 08-08 0 48 技术文档

引言：Stable Diffusion 概述在人工智能图像生成领域，商业工具如Midjourney凭借其集成化服务与高质量输出占据市场，而Stable Diffusion（简称SD）则以开...

Bloger 08-08 0 705 技术文档

张吕敏最新开源的 FramePack 带来了颠覆性解决方案！作为一种下一代视频生成框架，通过智能压缩输入帧上下文，让视频扩散模型的计算瓶颈与视频长度 “脱钩”，...

Bloger 08-08 0 236 技术文档

最近很多小伙伴在后台留言：“为什么我跑图时总提示CUDA out of memory？”“生成一张图要等10分钟，显存炸了怎么办？”别慌！今天这篇保姆级教程，手把手教你...

Bloger 08-07 0 620 技术文档

「源力觉醒创作者计划」_文心大模型 4.5 开源 28 天：从车间轴承到山村课堂的 AI 突围引言：正文：一、硬件突破：小显存也能驾驭大模型 1.1 ...

Bloger 08-07 0 958 技术文档