• 正文
    • 1.什么是数据挖掘
    • 2.数据挖掘的作用和意义
    • 3.数据挖掘的目的
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

数据挖掘

2022/11/30 作者:eefocus_3880508
阅读需 6 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

1.什么是数据挖掘

需要是发明之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。

数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。知识发现过程由以下三个阶段组成:①数据准备;②数据挖掘;③结果表达和解释。数据挖掘可以与用户或知识库交互。

数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理、生产控制、市场分析、工程设计和科学探索等。数据挖掘利用了来自如下一些领域的思想:①来自统计学的抽样、估计和假设检验;②人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。

什么是数据挖掘

2.数据挖掘的作用和意义

数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。

数据挖掘是指通过大量数据集进行分类的自动化过程,以通过数据分析来识别趋势和模式,建立关系来解决业务问题。换句话说,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。

数据挖掘的作用体现在数据挖掘的定义上,作用就是从大量的数据中搜索出隐藏于其中有用的信息。

数据挖掘的作用和意义

3.数据挖掘的目的

很多人会问:数据挖掘的目的是什么呢?我们总结数据挖掘主要有以下三个目的:

(1)把握趋势和模式;通过分析网购交易的记录数据、呼叫中心内的投诉数据、顾客满意度的调查数据、购物数据等,可以把把握顾客的购买意愿和类型、投诉的种类等信息。数据挖掘工具(方法)中神经网络、购物篮分析,粗糙(Rough)集、对应分析(双尺度法)、主成分分析、聚类分析等。

(2)预测;利用数万个数据进行预测,最有效的方法是神经网络法,它是具有强大功能的工具,即使数据是非线性关系也无妨。伹缺点是,需要大量数据并且因子分析的功能弱。利用数十个、数百个数据进行预测(和因子分析)的方法有回归分析、判别分析、逻辑回归分析、数量化理论I、数量化理论II等,另外,预测时间序列数据的方祛有灰色理论、最近邻法、霍尔特(Holt)法、指数平滑法、移动平均祛、博克斯-詹金斯(Box-Jenkins)法(ARIMA模型)、数量化理论I等。

(3)求最优解。在多种约束条什下,要实现利益最大化或者成本最小化,应该怎样求解参数(未知参数)呢?使用Excel的规划求解可以轻松地解决这个问题。

数据挖掘的目的

相关推荐

电子产业图谱

TA的热门作品
查看更多