显存 - 第2页|程序员档案馆

llama.cpp如何部署deepseek_llama-cpp-python deepseek

以下是使用llama.cpp 部署DeepSeek模型的完整指南一、环境准备安装llama.cpp 克隆仓库并编译： git clone https://github.com/ggerganov/llama.cpp cd l...

Bloger 09-02 0 767 技术文档

文章目录正常导入Llama 使用modelscope下载使用transformers导入 24GB显存导入拓展正常导入Llama 正常情况下，使用如下代码导入meta-llama/Ll...

Bloger 09-02 0 509 技术文档

DeepSpeed 是由微软开发的开源深度学习优化框架，专为超大规模模型训练与推理设计，通过显存优化、并行策略和通信加速等核心技术，显著提升训练效率并降低资...

Bloger 09-02 0 408 技术文档

引言：Stable Diffusion 概述在人工智能图像生成领域，商业工具如Midjourney凭借其集成化服务与高质量输出占据市场，而Stable Diffusion（简称SD）则以开...

Bloger 09-02 0 248 技术文档

张吕敏最新开源的 FramePack 带来了颠覆性解决方案！作为一种下一代视频生成框架，通过智能压缩输入帧上下文，让视频扩散模型的计算瓶颈与视频长度 “脱钩”，...

Bloger 09-02 0 505 技术文档

引言随着大语言模型（LLM）参数规模突破千亿级，基于人类反馈的强化学习（RLHF）成为提升模型对齐能力的关键技术。OpenRLHF、verl、LLaMA-Factory和SWIFT作...

Bloger 09-02 0 652 技术文档

张吕敏最新开源的 FramePack 带来了颠覆性解决方案！作为一种下一代视频生成框架，通过智能压缩输入帧上下文，让视频扩散模型的计算瓶颈与视频长度 “脱钩”，...

Bloger 09-02 0 902 技术文档

最近很多小伙伴在后台留言：“为什么我跑图时总提示CUDA out of memory？”“生成一张图要等10分钟，显存炸了怎么办？”别慌！今天这篇保姆级教程，手把手教你...

Bloger 09-02 0 791 技术文档

「源力觉醒创作者计划」_文心大模型 4.5 开源 28 天：从车间轴承到山村课堂的 AI 突围引言：正文：一、硬件突破：小显存也能驾驭大模型 1.1 ...

Bloger 09-02 0 200 技术文档

FLUX.1-Kontext-dev 是 Black Forest Labs 开发的一款开源 AI 图像编辑模型，主打“上下文感知”能力，只需要输入对应的提示词文字，即可像人类修图师一样根...

Bloger 08-15 0 403 技术文档