华为云Flexus+DeepSeek征文|从云服务器部署到插件获取极全性能趋势图再打造知识库工作流应用
前引:云计算正以前所未有的速度重塑企业的技术基础设施。随着人工智能技术的迅猛发展,传统的云服务部署模式正在经历深刻的变革。华为云作为全球领先的云服务提供商,不仅在基础设施建设上不断突破,更在智能化服务领域展现出卓越的创新能力。当今的企业面临着前所未有的技术挑战:如何构建既安全又高效、既灵活又可靠的云服务架构?如何有效整合人工智能技术,打造智能化的运维和服务体系?这些问题的答案,正在悄然改变着企业级IT基础设施的生态。本文将深入探讨华为云在高可用架构部署和智能Agent搭建方面的最佳实践。我们将从技术架构、部署策略到性能优化,全方位解析企业级云服务的进化路径,为读者呈现一幅云计算与人工智能融合的宏大画卷,相信在小编的带领下,你可以收货一个不错的部署旅程~
目录
【一】论架构的重要性
(1)单机部署的架构特点
(2)CCE高可用部署架构特点
(3)部署安全优势保证
【二】本文研究目标
【三】开通DeepSeek R1/V3商用服务
(1)开通教程
(2)商用版开通体验
【四】云服务单机部署方案
(1)部署策略
(2)部署体验
(3)适用场景分析
【五】如何监控云服务单机部署的性能
(1)可监控指标:
(2)监控方法:
(3)安装插件:
(4)云监控:
【六】CCE高可用部署方案
(1)前置准备
创建委托
委托授权
设置桶
设置秘钥
(2)部署策略
(3)部署体验
(3)适用场景分析
【七】使用集群监控CCE节点性能
(1)可监控参数:
(2)集群监控方法:
【八】Dify-LLM基础登录
【九】华为云平台Maas服务对接
【十】搭建知识库助手
【十一】搭建智能问答专家
测试:
【十二】运用知识库:解答高考试卷
测试:
【十三】如何删除资源停止计费
【十四】性能优势
【十五】总结与期望
【一】论架构的重要性
在当今快速变化的数字经济时代,云计算已经成为企业技术创新和业务增长的关键驱动力。华为云架构的设计不仅仅是技术堆砌,更是一种面向未来的战略性基础设施解决方案。其核心价值在于为企业提供灵活、安全、高效的云服务部署模式,使organizations能够快速响应市场变化,持续保持竞争力。华为云架构的真正价值,不仅在于其技术本身,更在于它为企业数字化转型提供了一个灵活、可靠的技术底座。通过精细化的架构设计,华为云帮助企业在数字经济时代获得持续竞争力,实现业务的快速迭代和创新,例如架构描述:
(1)单机部署的架构特点
单机部署架构是华为云为中小型企业和初创公司量身定制的解决方案。其主要特点包括以下方面:
快速部署:单一云服务器实例可以在极短时间内完成应用环境搭建,大大缩短了从开发到上线的周期
成本经济:对于资源需求相对有限的场景,单机部署可以最大程度地降低基础设施投入,实现低成本高效能
简单管理:配置straightforward,运维成本低,非常适合技术团队规模较小的企业
(2)CCE高可用部署架构特点
与单机部署相比,高可用部署架构展现了更为复杂和强大的系统能力:
容错性:通过多节点部署和负载均衡机制,即使单个服务器发生故障,整个系统依然能够保持稳定运行
弹性扩展:可根据业务流量动态调整资源,实现自动扩容和缩容,确保系统始终保持最佳性能状态
安全性:多层次的安全防护机制,包括安全组、NAT网关等,为企业级应用提供全方位的安全保护
高性能:分布式架构使得系统可以承载更大的并发量,满足高强度、大流量的业务需求
(3)部署安全优势保证
我们先看下面这张云服务安全监控图:
它的左边功能栏提供了:云服务监控、自定义监控、站点、网络监控等非常多的保障
在控制台我们看到各种功能,不仅不复杂反而让用户可以快速上手使用,监控自己开通的各种服务,以及查找所需要的各种配置,例如:
对于处于创业初期或者进行技术探索的企业,单机部署提供了低门槛的入口。而对于已经进入快速发展期、对系统稳定性和性能有严格要求的企业,高可用部署则是不二之选!
【二】本文研究目标
本文的研究方向将从下面这十个方面展开:
(1)开通DeepSeek R1/V3商用服务以及概率它的开通体验
(2)手把手教学云服务单机部署方案以及适用场景分析
(3)教学CCE高可用部署的全部过程、注意事项、场景分析
(4)完成Dify-LLM的基础登录操作
(5)完成MaaS的对接
(6)教学搭建知识库助手
(7)教学如何搭建自己的AI工作流
(8)教学Agent、聊天助手的应用部署
(9)谈论云服务单机部署与CCE高可用部署过程体验与性能评估
(10)总结部署感受与搭建Agent中的心得
【三】开通DeepSeek R1/V3商用服务
(1)开通教程
(1)新人需要先登录完成认证,然后打开ModelArts Studio控制台
(2)选择在线推理,开通自己喜欢的模型即可(注意:商用版不使用是不会收费,免费版可验)
(3)在ModelArts Studio控制台看是否有权限未开启,这可能导致后面使用模型时报错
(2)商用版开通体验
商用版的开通无疑就是:特快,从点进控制台开始,只需要两步就可以完成开通,体验一场尽心的AI对话,且收费低,不用担心多次使用产生巨额的费用,可以忽略不计,模型反应快速,几乎一提问题就开始输出,“立刻输出”和“思考了几秒再输出”二者体验不是同的,例如:
【四】云服务单机部署方案
(1)部署策略
(1)点击单机部署
(2)直接用默认模板,点击下一步
(3)版本和加密自由选择即可,注意密码的格式一定要正确
(4)打开回滚设置可以提高效率,委托和删除保护可以不管
(5)创建执行计划
(6)待显示创建成功之后开始部署
(7)这个过程大概要10分钟,待显示部署成功
(8)这里“输出”里面的“IP”就是等会要登录Dify-LLM使用的网址,记得妥善保管
(2)部署体验
单机部署更实用于:中小型项目、开发测试环境、成本敏感型场景
建议可以:使用云原生服务、实现日志集中管理、定期进行安全扫描
云服务单机部署成本很低很低,几块足矣,适用于新手体验,部署快捷,出现故障需要手动
(3)适用场景分析
对于处于初创阶段的技术团队和创新项目,单机部署提供了最经济、最快速的技术验证路径:
概念验证:快速搭建开发环境,快速验证技术可行性
原型开发:低成本构建最小可行产品(MVP)
技术预研:在不增加过多基础设施成本的前提下进行技术探索
中小企业往往面临资源受限的挑战,单机部署为他们提供了理想的基础架构选择:
个人博客与中小型网站:稳定、低成本的托管方案
小型电商平台:初期业务量不大时的理想选择
内部管理系统:如OA、简单的CRM系统等
软件开发过程中,单机部署为开发者提供了灵活的部署选择:
开发环境模拟:快速搭建与生产环境类似的测试场景
持续集成/持续部署(CI/CD)的轻量节点:支持自动化测试流程
微服务单元测试:独立部署测试单一服务组件
对于开发者和创意工作者,单机部署降低了技术门槛:
个人作品展示:低成本的网站托管
创意原型快速上线:快速验证商业想法
个人技术博客与作品集:展示专业能力的平台
【五】如何监控云服务单机部署的性能
(1)可监控指标:
CPU使用率:查看CPU是否空闲或过于繁忙
内存使用率:监控内存是否充足
磁盘使用率:监控磁盘空间是否即将耗尽
磁盘读写速率(IOPS):分析磁盘性能瓶颈
网络入/出带宽:查看公网或内网流量情况
GPU使用率/显存使用率
(2)监控方法:
华为云云服务监控 :这是最简单、最实用的测量工具,采用图形化趋势分析
(3)安装插件:
(1)等云服务器部署完成之后
(2)然后去云服务控制台,点击弹性云服务器,点击上面的Flexus实例或者直接搜索也行
(3)在“Flexus X实例”点击远程登录
(4)点击立刻登录
(5)先输入root,然后回车,再输入部署设置的密码(注意:密码的输入不会显示)再回车
(6)这样的界面下,我们需要回到云监控服务复制 Linux 的执行命名
(7)点击弹性云云服务器,点击“开始详细监控”,点击 Linux,复制下面的执行命名
(8)然后回到登录界面,点击左上角的复制粘贴,粘贴命名然后发送
(9)这样就表示成功了,然后等待3~5分钟,就可以开始我们的“操作步骤”查看部署性能了
(4)云监控:
注意:云监控需要先完成插件的安装,才可以执行此操作(否则只有基础的可以使用)
(1)登录华为云控制台
(2)搜索“Flexus云服务”,点击Flexus X实例,点击这个已经部署的实例
(3)点击“监控”,点击“操作系统监控”,这样就可以查看部署的服务器实时性能参数
【六】CCE高可用部署方案
(1)前置准备
创建委托
(1)在搜索栏搜索委托 rf_admin_trust ,没有则需要创建并且需要检查权限
(2)委托名设置为: rf_admin_trust ,选择云服务、RFS资源编排
(3)点击立刻授权
(4)搜索:Tenant Administrator 这个权限添加
(5)选择所有资源,点击确定
委托授权
打开云容器引擎CCE,授权委托
设置桶
(1)可以直接在控制台搜索:桶,接下来左边功能区找到“桶列表”,没有桶则需要创建新的
(2)配置桶,频率使用不高可以选择低频更经济,点击创建
(3)创建之后我们可以看到下面这样的界面,后面会用到桶名字
设置秘钥
(1)在控制台搜:“我的凭证”
(2)创建秘钥,设置完基本信息后点击下载保存文档,后面会使用文档里的秘钥ID、秘钥
(2)部署策略
(1)点击华为云高可用部署
(2)支持默认模板,下一步即可
(3)所有密码需要注意格式是否正确,下面将本页面拉到最下面
(4)上面三个:桶名称、秘钥ID、秘钥,就是我们刚才在“前置准备”获取的,直接赋值粘贴即可
(5)委托必须设置,否则会出现CCE集群部署失败等报错,点击我们刚才那个rf开头的委托
(6)创建执行计划
(7)点击创建
(8)创建成功之后开始部署
(9)等待部署成功,这个过程大概18分钟很正常,比单机部署要长一些
(10)在“输出”里面的IP就是登录Dify-LLM需要的网址IP
(3)部署体验
高可用部署的核心目标是消除单点故障,提高系统的可靠性和稳定性,例如:
比如它的关键组件:负载均衡器(ELB)、多可用区部署、弹性伸缩组、云服务器组
网络规划:创建VPC(虚拟私有云)、规划子网,至少跨越2个可用区、 配置安全组和网络ACL
在部署的时候需要特别注意:桶、委托、权限的设置,否则很容易出现CCE集群的部署报错
如果出现故障是可以自动恢复的,适用于生成环境,扩展性很强!
(3)适用场景分析
华为云CCE高可用架构的核心竞争力体现在:
多节点部署:自动故障切换,确保服务连续性
智能调度:根据业务负载自动调整资源分配
安全隔离:多层次的安全防护机制
跨可用区部署:提供地理级别的容灾能力
金融领域对系统的可靠性和安全性有着极其严苛的要求,CCE高可用架构为其提供了理想的技术解决方案:
核心交易系统:确保24/7不间断运行,支持高并发、低延迟的交易需求
风控与反欺诈系统:提供弹性扩展能力,快速应对复杂的风控场景
金融大数据分析:支持海量数据实时处理和复杂计算
对于传统大型企业,CCE提供了云原生转型的关键技术路径:
混合云部署:无缝连接传统数据中心和公有云
企业级应用容器化:降低运维复杂度,提高资源利用率
DevOps流程优化:加速研发到生产的交付周期
AI和大数据领域对计算资源的弹性和稳定性要求极高:
分布式机器学习:支持大规模并行计算
实时数据处理:提供高性能、低延迟的计算环境
模型训练与推理:灵活调度计算资源,优化算力分配
【七】使用集群监控CCE节点性能
(1)可监控参数:
工作负载状态:您的应用是否都在正常运行
节点列表:列出集群中所有的云服务器节点,每个节点的状态、IP、CPU和内存的分配率
集群资源概览:整个集群总的CPU、内存的 请求量和 限制量
CPU使用率、内存、磁盘I/O、网络带宽等
(2)集群监控方法:
(1)进入云服务引擎CCE,找到集群管理
(2)点击集群管理,就可以看见已经部署的集群了,点击进去
(3)左边工作栏找到“节点管理”,再点击“节点”->“监控”
(4)可以点击“查看更多数据”,就可以观察集群的性能图形化分析了
【八】Dify-LLM基础登录
(1)打开上面部署成功的IP,高可用和单机部署登录Dify的过程是一样的,设置邮箱账号
(2)重新登录邮箱
(3)登录进去就可以看见下面这样的画面
【九】华为云平台Maas服务对接
(1)登录Dify进去之后,点击设置
(2)在模型供应商找到Maas这个模型,进行添加
(3)选择LLM,接下来要填名称、秘钥、地址,我们分开教学
名称、地址的获取:
打开ModelArts Studio,选择在线推理,点击模型调用说明
点击调用说明,打开右边的OPenAI,就可以获得了
秘钥获取:
在刚才“在线推理”界面的最下方有个API管理,点击API
然后创建一个秘钥,注意秘钥只会显示一次,否则就需要重新创建
复制粘贴这个秘钥在刚才的配置栏里面就行
(4)然后依次赋值粘贴这些名称、秘钥、地址,就行了,其它配置可以选择默认,保存即可
(5)这样就表示添加成功了
【十】搭建知识库助手
(1)点击知识库
(2)导入个性化文档文本
(3)支持默认配置,直接下一步
(4)点击前往文档查看文档是否可用,如果可用就表示搭建成功了
【十一】搭建智能问答专家
(1)选择空白应用
(2)选择Chatflow,设置名字,下一步
(3)点击生成,输入自己需要的提示词,例如:
## 角色设定
你是一位名为**智研助手**的AI智能问答助手,专注于提供准确、清晰、简洁、有用且安全的回答。你由[您的公司/组织名称]开发,旨在帮助用户高效获取知识和解决问题。你知识渊博,善于理解复杂问题,并能用通俗易懂的方式解释专业概念## 核心指令
1. **理解意图:** 仔细分析用户问题背后的核心诉求,区分是寻求信息、解决方案、解释说明还是创意建议
2. **信息检索与生成:** 基于你庞大的知识库(截至2024年7月)进行信息提取、推理、整合和生成,确保信息的**准确性**和**时效性**。不知道就说不知道
3. **结构化输出:** 答案力求**清晰、简洁、重点突出**。复杂问题请分步骤说明或分点列举(使用1., 2., 3., ...;或使用小标题如**说明:**,**原因:**,**步骤:**,**建议:**等)。关键信息可适当加粗(使用**加粗**)
4. **安全性与责任:** 严格遵守安全准则,拒绝生成或讨论违法、有害、歧视性、侵犯隐私、虚假信息等内容。如遇敏感问题,礼貌拒绝并说明原因
5. **问题澄清:** 当问题模糊、信息不足或范围过广时,主动、礼貌地要求用户提供更多细节或缩小范围
6. **多轮对话:** 能自然承接对话历史上下文,理解用户的后续提问与之前对话的联系
7. **语气风格:** 保持**专业、友好、耐心、乐于助人**的语气。避免过度口语化和俚语,力求规范的中文表达。称呼用户为“您”## 特定能力与限制
* **知识范围:** 我的知识覆盖广泛的领域(科学、技术、文化、历史、生活等),但更新截止于**2024年7月**。之后发生的事件或信息可能不了解
* **文件处理(如适用):** [若助手支持读取文件]:您可以上传文件(如txt, pdf, docx, pptx, xlsx, 图片等),我会提取其中文字信息并据此回答问题。请确保文件内容清晰、相关
* **无感官体验:** 我无法进行看、听、尝、闻、触等感官操作,只能处理和分析文本或文件中的信息
* **无实时访问:** 我无法直接浏览互联网获取最新网页内容(除非系统提供特定联网功能)
* **创意辅助:** 可以提供思路、建议、大纲或修改,但明确告知用户内容是AI生成的,需用户自行判断和完善## 响应格式要求
* **开头问候(可选):** 根据场景和语气,可以用简短问候(如“您好!”)或直接进入正题
* **核心答案:** 直接回应问题核心,按需结构化组织
* **结尾(可选):** 根据情况可用“希望以上信息对您有帮助!”或提出澄清性/跟进性问题## 示例对话
**用户:** 解释一下量子纠缠的基本概念
**智研助手:** 您好!量子纠缠是量子力学中一个非常奇妙的现象。简单来说:
* **核心概念:** 两个或多个粒子(比如光子或电子)因为特定的相互作用(如来自同一源头),会形成一个相互关联的整体系统,即使它们后来在空间上被**分隔到任意远的距离**
* **神奇特性:** 对一个粒子的状态进行测量会**瞬时影响**其他纠缠粒子的状态,无论它们相隔多远。这种关联性是瞬时的,**超越了光速的限制**,但请注意,这**不能**用来传递信息(违反相对论)
* **并非信息传递:** 虽然测量结果是瞬时的,但这种关联在测量前是随机、不确定的,只有通过后来比较双方的测量结果才能发现关联性,因此无法用于超光速通信
**总结:** 量子纠缠展示了微观粒子之间超越经典物理理解的强关联性,是量子计算和量子通信的重要基础。希望这个解释清晰!**用户:** 帮我想几个关于人工智能未来的讨论主题
**智研助手:** 好的,这里有几个关于人工智能未来的讨论角度:
1. **伦理与责任:** AI决策如何确保公平性?AI犯错由谁负责?自主武器系统的伦理困境。
2. **就业与社会变革:** 哪些职业会被取代?人类与AI如何协作?如何解决大规模失业和再培训问题?
3. **超级智能与对齐问题:** 如果AI发展出远超人类的智能,如何确保它的人类目标(Alignment Problem)?风险有多大?
4. **安全与监管:** 如何防止AI滥用(如深度伪造、自动化攻击)?需要建立哪些国际监管框架?
5. **人工智能与创造力:** AI创作的音乐、艺术、文学会改变我们对“创造力”的理解吗?版权归属?
6. **人工智能与医疗:** 精准医疗、药物研发、个性化治疗,以及生物伦理和数据隐私挑战
7. **人工智能与环境:** AI如何助力解决气候变化(如优化能源、气候建模)?AI本身的高能耗问题如何解决?
这些主题都可以深入探讨,您对哪个方向更感兴趣呢?## 关键参数(请替换括号中的提示)
* **[您的公司/组织名称]**: 将 `[您的公司/组织名称]` 替换为您实际的名称(如:知汇科技)
* **(可选)[若助手支持读取文件]**: 如果您的助手确实支持文件上传和内容提取功能,请保留方括号内说明及“如适用”部分的描述。如果不支持,请删除整个“`* **文件处理(如适用):** [若助手支持读取文件]:您可以上传文件(如txt, pdf, docx, pptx, xlsx, 图片等),我会提取其中文字信息并据此回答问题。请确保文件内容清晰、相关`”
(4)右边支持“效果预览”,没问题之后点击发布,更新运行
测试:
可以看到是可以没有任何问题的:
【十二】运用知识库:解答高考试卷
(1)点击导入DSL文件
(2)复制下面的URL粘贴
https://documentation-samples.obs.cn-north-4.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-moudle/building-a-dify-llm-application-development-platform/workflow/DeepSeek_searXNG%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2_%E7%9F%A5%E8%AF%86%E5%BA%93.yml
(3)在检索知识点,添加高考试卷
(4)找到“大模型”,按照提示切换为刚才对接的模型
继续寻找“大模型”进行切换
(5)找到搜索,需要根据自己部署的方式进行授权
单击授权按钮,并添加URL。单机版部署填写Dify服务器私网IP:http://{ECS私网IP}:8080;高可用部署填写URL:http://searxng:8080。如下图所示,单击“保存”后,即可设置成功。(ECS私网IP是部署Dify的虚机的内网ip,如连接不通,请检查虚机的安全组是否放通8080端口号)
单机部署的私网IP获取地址:
(6)没问题之后点击发布,更新,运行即可
测试:
我们可以看到,它可以指定搜索试卷的第N题,切回答吻合预期,响应迅速
【十三】如何删除资源停止计费
(1)在控制台搜索栏搜索“资源编排”打开
(2)然后点击“资源栈”,在这里面可以看到已经部署成功的资源
(3)如果要停止计费,点击“删除”即可
【十四】性能优势
在部署成功登录Dify之后,我们搭建了各种AI应用,它的效率、算力等各种优势体现如下:
(1)异构计算能力
提供从通用GPU到专用AI加速卡的全系列计算资源
支持Nvidia A100、V100等高性能GPU
可实现大模型训练和推理的极致性能(2)弹性伸缩架构
秒级启动计算实例
根据AI应用负载动态调整资源
显著降低计算成本,提高资源利用率CCE工作负载弹性伸缩
(3)边缘协同计算
结合云端和边缘节点
为AI推理提供更低延迟的计算体验
支持复杂AI任务的分布式处理
在部署上,华为云高可用与单机部署的区别如下:
维度 单机部署 高可用版 资源组成 单云服务器 + 弹性公网IP CCE集群 + NAT网关 + Redis + OBS + CSS + ELB 部署耗时 10分钟 20分钟(含集群初始化) 预估成本 2~5元/天(按需计费) 35~70元/天(峰值资源按需叠加) 故障恢复 手动恢复 自动故障转移(NAT+ELB冗余) 扩展性 需手动升级实例规格 支持自动扩缩容(CPU/内存按需调整) 推荐场景 原型验证、低成本测试 企业级生产环境、高稳定性需求
算力差别如下,希望可以为广大开发者提供借鉴:
指标 单机部署 高可用版 算力核心 2 vCPU + 4GB内存 4核8G(CCE集群自动扩缩容) 存储 50GB云硬盘 + 10Mbps弹性公网带宽 分布式存储(Ceph)+ 负载均衡 响应延迟 平均1.2s(推理请求) 0.7s(负载均衡优化) 并发能力 支持50 QPS 300 QPS(自动横向扩展) 适用场景 个人开发/轻量级应用 企业级多用户/高并发场景
【十五】总结与期望
活动期间,我选择华为云“一键部署”方式快速搭建环境,从云服务单机部署再到CCE高可用部署,最后搭建AI,我的心得体验如下,希望可以带来参考:
华为云的交互设计非常友好:在控制台选择地域后,系统自动完成CCE集群初始化、弹性公网IP绑定等复杂配置,全程耗时约20分钟。对比单机部署模式(需手动关联FIP与云服务器),我更青睐CCE高可用方案的弹性伸缩能力——通过NAT网关与负载均衡的自动流量分发,平台在模拟高并发场景下仍保持稳定响应,这让我直观感受到云原生架构的优势!
成本方面,按需计费的模式极具吸引力。我选择保留高可用集群,单机部署大概几块就可以完成,高可用我大概花了60块(快速部署再到->搭建AI->使用AI)性价比很高。最终费用约70元(低于预估上限100元),且支持随时释放资源。这种灵活的计费方式,特别适合需要快速验证概念的开发者!
在“开发实践”环节,我后面重新部署基于Dify构建一个智能客服场景的Agent。平台预置的LLM调用接口与插件市场大幅降低了开发门槛,如愿搭建出了3个左右的智能应用体验感很好
此次测评让我深刻体会到华为云部署AI理念的落地价值:
技术整合力:从ModelArts Studio的模型推理到Dify的应用编排,华为云打通了“大模型训练-部署-应用”的全链路,大幅降低企业级AI开发门槛。
社区赋能:活动提供的部署指南、源码仓库与社区答疑通道,构建了高效的开发者支持体系。
未来,我计划将本次实践复刻到公司内部的知识管理项目中,并探索通过“完整的工作流”增强Agent的实时信息获取能力。感谢华为云提供如此贴近实战的测评机会,期待更多开发者通过此类活动释放创新潜力!