> 技术文档 > 第八章:揭秘云计算、大数据、物联网与AI的未来_大数据与云计算

第八章:揭秘云计算、大数据、物联网与AI的未来_大数据与云计算


一、云计算

1、云计算的特点:

以下是以表格形式总结的云计算特点:

特点名称 描述 举例 优势 资源虚拟化 将物理资源抽象为虚拟资源,用户无需关心底层硬件细节 使用云存储服务,无需知道数据存储在哪台物理服务器上 提高资源利用率,降低使用门槛,方便灵活调整资源 高可扩展性 能根据业务量增长或减少,快速动态调整资源分配 电商促销活动期间,云计算平台迅速分配更多计算资源 应对业务波动性,降低前期投资和运维成本,提高应变能力 按需自助服务 用户可根据需求,通过自助方式获取和使用云计算资源 用户自主选择云服务器配置、操作系统、开通时间等 提高获取资源效率,快速部署和开展业务,减少人工干预 广泛的网络接入 用户可通过各种网络设备和连接方式随时随地访问云计算服务 员工在办公室和外出时,分别通过有线网络和移动网络访问云端办公软件 打破时间和空间限制,提供便捷高效服务体验,促进新型工作模式发展 资源池化 将大量资源整合成统一资源池,通过多租户技术为多个用户提供共享服务 多个企业或个人用户同时使用同一个云存储资源池 提高资源共享程度和利用率,降低单个用户成本,便于统一管理和维护 可度量服务 通过计量手段对用户使用的资源进行精确测量和统计,并根据使用量计费 云服务器服务按照使用时长、CPU使用率等指标计费 提供透明计费方式,使用户更好控制成本,便于资源管理和成本核算 高可靠性 采用多种技术手段保障系统稳定性和数据可靠性,确保服务正常运行 云服务提供商在不同地理位置建立多个数据中心,进行数据同步和备份 降低用户因系统故障或数据丢失带来的风险,提高信任度,适用于对数据安全和业务连续性要求高的企业和行业

2、云计算的三种层次服务:

云计算提供的层次分为3个层次:基础架构即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)

基础架构即服务(IaaS):提供虚拟化硬件资源(如云服务器、网络、存储)需自行管理操作系统、中间件和应用。位于云计算三层服务的最底层。

平台即服务(PaaS):提供开发环境(数据库、中间件、运行时),只需要专注应用代码的开发。位于云计算三层服务的中间。

软件即服务(SaaS):直接提供即用型软件(通过浏览器或客户端访问),仅配置使用,无需维护。位于云计算三层服务的最顶端。

3、云计算的部署模型:

云计算有四种部署模型,每一种都有独特的功能。

(1)公有云:资源由第三方云服务商提供。用户无需自行建设和维护基础设施,只需按使用量付费即可。

特点:灵活性高、免运维基础设施、成本效益好、再被能力强。

(2)私有云:专供单一组织使用的云基础设施,可自建或由第三方托管。

特点:安全性高、定制化程度高、资本独占。

(3)混合云:结合了公有云和私有云的优势,将关键业务和数据部署在私有云中,以确保安全性和控制;将非关键业务或需要弹性扩展的业务部署在公有云中,以降低成本和提高灵活性。两种云之间通过安全的技术手段进行连接和数据交互。

特点:灵活性高、成本效益好、关键业务本地化,弹性需求上公有云。

(4)社区云:由多个组织共享的云设施(通常为同行业或共同利益群体)。

特点:成本分摊、有限范围共享、合作性强。

二、大数据

广义定义:大数据指物理世界到数字世界的映射和提炼,通过发现其中的数据特征,激活数据价值,从而做出提升效率的决策行为。

狭义定义:大数据指通过对数据的获取、存储、分析,从大容量数据中挖掘价值的一种全新的技术架构。

1、大数据的5V特征:

  • Volume(大量):数据规模大(TB/PB级)。

  • Velocity(高速):数据生成和处理速度快(如实时日志流)。

  • Variety(多样):数据类型多样(结构化、半结构化、非结构化)。

  • Value(低价值密度):需挖掘有效信息(如监控视频中的关键帧)。

  • Veracity(真实性):数据质量与可信度(如社交媒体噪声数据)。

2、类型

  • 结构化数据:以关系型数据库表形式管理的数据,例如企业ERP、OA、HR里的数据。

  • 非结构化数据:数据结构不完整或者不规则,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据,例如Word、PDF、PPT及各种格式的图片、视频等。

  • 半结构化数据:非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、E-mail等。

3、关键技术

  • 数据采集与存储:通过ETL(Extract, Transform, Load)等技术,从各种源头收集数据,并利用分布式存储系统(如Hadoop HDFS)进行高效存储。

  • 数据治理与分析:利用MapReduce、Spark等分布式计算框架,对数据进行清洗、转换和聚合,再通过机器学习、数据挖掘等技术挖掘数据背后的价值。

  • 数据可视化:通过图表、仪表盘等工具,将复杂的数据分析结果以直观的方式展现出来,帮助非技术人员理解数据。

  • 数据管理:应用数据库管理、数据仓库等信息系统技术和其他数据管理工具,完成组织数据资源管理任务。

  • 数据安全与隐私保护:采用加密、脱敏等技术手段确保数据安全。

4、应用场景

  • 产业经济领域:用于产业监测、产业规划、政策制定、资源调度等方面。

  • 商业市场领域:用于市场营销、客户关系管理、风险监控、供应链管理等方面。

  • 医疗健康领域:用于疾病预测、医疗诊断、药物研发等方面。

  • 城市规划领域:用于交通管理、资源配置、环境监测、公共安全等方面。

  • 科学研究领域:用于天文学、生物学、物理学等各个学科。

  • 政府治理领域:如智能交通、智能医疗、智能教育等。

  • 金融行业:如风险管理、信用评估、投资决策等。

  • 零售业:如客户画像、精准营销、供应链管理等。

  • 制造业:如智能制造、生产优化、产品研发等。

  • 农业:如智能农业、农业大数据分析等。

5、发展趋势

  • 资产化大数据价值不断提升,在企业和社会层面成为重要的战略资源、无形资产。

  • 智能化大数据将更加智能化,可以自动进行数据处理和分析,提高数据处理效率和质量。

  • 个性化:大数据将更加关注用户需求,实现个性化服务和定制化产品。

  • 安全性大数据将更加注重数据安全,采用更加严格的数据保护措施,确保数据的安全性和隐私性。

6、大数据处理的思维方式的3个特点:

(1)不是抽样统计,而是面对全体样本;

(2)允许不精确和混杂性。

(3)不是因果关系,而是相互关系。

三、物联网

物联网:”即物物相连的互联网“,核心与基础仍然是互联网。

物联网包括了多种不同的通信模式:人与人通信、物与人通信、物与物通信

1、物联网的关键技术

相关技术

描述

感知与识别技术

RFID技术

RFID即射频识别技术,俗称电子标签,通过射频信号自动识别目标对象,并对其感知巨 RFID技术 信息进行标志、登记、存储和管理。RFID是一个可以让物品“开口说话”的关键技术,是物联网的基础技术。例如常见的ETC系统就采用了RFID技术进行车辆识别

传感技术

传感技术是从自然信源获取信息,并对之进行处理和识别的现代科学与工程技术,传感技术 其涉及传感器、信息处理和识别技术。若计算机为处理和识别信息的“大脑”,那么传感器就类似人的“感觉器官”

通信与网络技术

IPV6技术

要构造一个物物相连的物联网,需要为每一个物体分配一个IP地址,那么大力发展IPv6技术是实现联网的网络基础条件

嵌入式技术

嵌入式系统将应用软件与硬件固化在一起,具有软件代码小、高度自动化、响应速入式技术 度快等特点,特别适合于要求实时和多任务的系统。嵌入式系统几乎应用在生活中所有地方,如掌上电脑、智能手机、医疗仪器设备等。嵌入式技术的发展为物联网实现智能控制提供了技术支撑

信息处理与服务技术

位置服务技术就是采用定位技术,确定智能物体的地理位置,利用地理信息系统技术与移动通信技术向物联网中的智能物体提供与位置有关的信息服务。与位置信息密切相关的技术包括遥感技术、北斗卫星定位系统等

2、物联网的典型架构

物联网典型的体系架构分为3层:感知层、网络层、应用层。

  • 感知层:由温湿度传感器、RFID标签、摄像头等构成,负责信息采集和信号处理。

  • 网络层:依托互联网、移动通信网、卫星通信网等,实现信息接入和传输。

  • 应用层:与行业需求结合,提供用户界面显示及管理设备,实现智能应用。

3、物联网的应用

  • 智慧交通利用物联网技术实现车辆监控、智能导航、交通流量管理。

  • 智能家居通过物联网设备实现家居自动化控制、环境监测、安全防护。

  • 工业物联网在制造业中实现设备监控、生产优化、预测性维护

四、人工智能

  1. 人工智能是研究、开发用于模拟、延申和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

  2. 人工智能的应用:机器人、模式识别、自然语言处理、智能检索。

  3. 人工智能面临的问题:数据隐私、安全威胁、算法歧视、人工主体权力。