1,微调技术 特征 Full-tuning Freeze-tuning LoRA QLoRA 训练参数量 全部 少量 极少 极少 显存需求 高 低 很低 最低 模型性能 最佳 中等 较好 接近 LoRA...
AIGC检测的基本原理:原理、方法与挑战 随着AIGC(人工智能生成内容)技术的飞速发展,大量文本、图像、音频乃至视频内容正在由AI生成。这为内容创作带来了...
LLaMA-Factory 模型 微调基础教程 LLaMA-Factory LLaMA-Factory 下载 Anaconda Anaconda 环境创建 软硬件依赖 详情 LLaMA-Factory 依赖安装 CUDA ...
1. 导入 如果你使用商用大模型,或者使用开源大模型本地化部署,除了生成的质量之外,另外一个关键的指标就是生成token的速度。而且并不是简单的每秒生成多...
大模型提示词学习路径:从入门到进阶的 6 个阶段 1. 阶段一:认知启蒙(0-2 周) 1.1 阶段目标 了解提示词的基本概念和作用,能写出最简单的指令让大模型完...
目录 1. 什么是RAG 2. RAG典型应用场景 3. RAG核心流程 3.1. 检索阶段 3.2. 生成阶段 4. 使用Spring AI实现RAG 4.1. 创建项目 4.2. 配置application.yml 4.3...
Qwen3 Embedding是阿里巴巴通义千问团队于2025年6月发布的最新文本嵌入和重排序模型系列,基于Qwen3基础大模型构建,专注于提升文本表征、信息检索和排序的...
DeepSeek各版本说明与优缺点分析 DeepSeek是最近人工智能领域备受瞩目的一个语言模型系列,其在不同版本的发布过程中,逐步加强了对多种任务的处理能力。本...
在测试的过程中,发现DS本身以及科大讯飞的语音模型并不是特别适合我们的这个项目,经过筛选之后,我觉得尝试接入多模态能力更强大、语音识别能力更强、流式...
目录 前言 一、Qwen3-Coder是谁?它想干嘛? 二、它凭什么这么牛?揭秘三大“杀手锏” 2.1 杀手锏一:人多力量大——神奇的MoE架构 2.2 杀手锏二:记性特别好——2...