模型 - 第8页|程序员档案馆

代码专用开源LLM深度评测：StarCoder、Code Llama等技术对比

代码专用开源LLM深度评测：StarCoder、Code Llama等技术对比【免费下载链接】open-llms 📋 A list of open LLMs available for commercial use. ...

Bloger 09-03 0 483 技术文档

引言：OpenAI开源里程碑，AI民主化加速到来 2025年8月，OpenAI正式宣布开源其两款重磅大语言模型——gpt-oss-120b（1200亿参数生产级模型）和gpt-oss-20b（200...

Bloger 09-03 0 444 技术文档

7月26日，新一代 AI Agent 开发平台扣子（Coze）宣布开源其两款核心产品：零代码开发平台 Coze Studio 以及调试工具扣子罗盘 Coze Loop。这两个项目均采用...

Bloger 09-03 0 747 技术文档

由于训练和推理都需要较大显存和算力，因此此后文章都围绕linux进行学习开发，便于大家花点小钱租个服务器就可以复现学习理解！（在这里许愿希望自己可以全...

Bloger 09-03 0 63 技术文档

本文作者系360奇舞团前端开发工程师背景前段时间接到一个任务，需要将老板的会议录音转为文本，方便助理整理会议纪要。由于是内部会议，对内容保密性要...

Bloger 09-03 0 12 技术文档

这里分享一篇文章《Large Language Diffusion Models》，来自人民大学高领人工智能学院，一篇尝试改变传统自回归范（预测下一个token） LLM 架构，探索扩散...

Bloger 09-03 0 728 技术文档

Qwen3 模型基础 Qwen3 作为推理模型，如果开启了推理模式，输出形式为 CotOutput 源码 https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md ...

Bloger 09-03 0 615 技术文档

提示词训练：如何通过多轮对话优化初始提问在使用大语言模型的过程中，我们常常会遇到这样的情况：第一次输入的提示词（也就是初始提问）不够理想，导致...

Bloger 09-03 0 897 技术文档

Stable Diffusion Web UI完全部署指南：从基础配置到高级优化前言：AI绘画革命与Stable Diffusion的崛起 2022年，Stable Diffusion的发布彻底改变了AI生成...

Bloger 09-03 0 619 技术文档

摘要：DeepSeek和AutoML技术革新了深度学习模型的构建与优化。DeepSeek，凭借其先进的混合专家架构和多头潜在注意力技术，显著提升了模型性能，同时大幅降低...

Bloger 09-03 0 973 技术文档