作者:admin 来源:燕郊人才资源网 发布时间:2018-01-09 10:52:24
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
抽取业务数据,辅助商业决策——企业福音
“大 数据”、“数据挖掘”袭来,无论是政府、还是企业,都渴望在这大数据时代占得先机。大数据中心、数据研究中心争相建立,如果说现在是互联网的天下,未来将 是大数据的天下。如果说大数据服务平台类似于互联网,则数据挖掘等同于互联网平台下的技术开发,数据挖掘的产品将遍及人们生活方方面面。
数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
简 而言之,数据挖掘其实是一类深层次的数据分析方法。数据分析本身已经有很多年的历史,只不过在过去数据收集和分析的目的是用于科学研究,另外,由于当时计 算能力的限制,对大数据量进行分析的复杂数据分析方法受到很大限制。现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据,这些数据不再是为 了分析的目的而收集的,而是由于纯机会的商业运作而产生。分析这些数据也不再是单纯为了研究的需要,更主要是为商业决策提供真正有价值的信息,进而获得利 润。但所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少。因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争 力的信息,就像从矿石中淘金一样,数据挖掘也因此而得名。
因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。
根据已知,预测未知——HR福音
“招聘难”、“离职率高”、“岗位配置多少人”、“这么高薪水员工都不满意”等问题困扰着绝大多数的HR,最大的心酸是长期奔波于招聘与离职管理,仍然不受各部门待见。
这是为什么呢?
因 为我们的工作存在滞后性,作为业务支持部门,无论是招聘还是其他,都是先由业务部门提出需求,我们人力资源部进行协助;这中间就存在滞后,常常导致任务 重,时间紧。于是出现了HR很累,业务部门还不满意的情况。所以要做好人力资源工作,无论是简单的人事管理,还是HRBP,都需要有前瞻性。
目前HR们也都想到了这一点,可是无奈人力资源事项多,数据类型格式不统一,更多的是非量化数据,心有余而力不足,基本是根据自己多年的经验,作出预测估计。预测结果准确性难以保证。
而数据挖掘的核心功能就在于“根据已知,预测未知”。
数据挖掘的三种预测技术:
第一种,根据过去,预测未来;
第二种,根据事物关联性预测;
第三种,根据一般情况判断异常情况。
第一种技术应用的特别多,相信每个HR都用过,只是没有留意到。
例如做人工成本预算,根据过去的人工成本,每年的平均涨薪幅度以及人员人数变动情况;
岗位编制,根据去年的编制以及每年的人员变动需要。
需要注意的是,应用第一种技术的条件是:需要预测的对象在较长时期内性质保持稳定。如人工成本在薪酬设计后需要注意,岗位编制在组织重构后需要注意。
根据事物关联性,应用起来相对复杂,需要多方面、多维度权衡。A与B有关联,简单理解是A发生了,B在某种概率上也会发生。目前HR用的最多的是直接的因果联系,很少有“啤酒尿布一起卖”这种关联性。
关联性将是未来HR最常用的技术,如何把不同类型的数据联系起来从而得出结论是关键。
特别要注意的一点是:关联性技术的应用面广,产品的应用面窄;通俗点说,哪里都能用关联性,但是每个关联性得到的结果只能应用在特定的条件下。
根据一般情况判断异常情况,这个技术在工业生产、科学实验中用得最多。产品故障与未知粒子的发现都是在一次次“异常”情况中分析得到的。适用于数据积累量大、机理相对成熟的事物预测。