Deeplearning Algorithms tutorial

谷歌的人工智能位于全球前列,在图像识别、语音识别、无人驾驶等技术上都已经落地。而百度实质意义上扛起了国内的人工智能的大旗,覆盖无人驾驶、智能助手、图像识别等许多层面。苹果业已开始全面拥抱机器学习,新产品进军家庭智能音箱并打造工作站级别Mac。另外,腾讯的深度学习平台Mariana已支持了微信语音识别的语音输入法、语音开放平台、长按语音消息转文本等产品,在微信图像识别中开始应用。全球前十大科技公司全部发力人工智能理论研究和应用的实现,虽然入门艰难,但是一旦入门,高手也就在你的不远处! AI的开发离不开算法那我们就接下来开始学习算法吧!

粗糙集理论

粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,是建立在分类机制的基础上的,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分,每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗糙集分析方法中用到的数据类型为离散型数据,对于连续型数据必须在处理前离散化。

粗糙集理论基本概念 定义1: 一个信息系统是一个四元组,可表示为:

粗糙集 - 图1

其中U为对象的非空有限集合;A为属性的非空有限集合;V为属性的值域集;f为信息函数,粗糙集 - 图2. 如果粗糙集 - 图3,粗糙集 - 图4,C为条件属性集,D为决策属性集,则把信息系统粗糙集 - 图5称为决策系统,用粗糙集 - 图6粗糙集 - 图7来表示,其中d为单一的决策属性。从数据库的角度来看,决策系统就是一张表,其中U是记录集合,A是字段集合,每一个对象对应一条记录,这样决策系统又可称为决策表。

定义2:在决策系统粗糙集 - 图8中,对于粗糙集 - 图9,则B在U上的不可分辨关系定义为:粗糙集 - 图10粗糙集 - 图11把U划分为k个等价类,粗糙集 - 图12,粗糙集 - 图13表示等价关系,粗糙集 - 图14的所有等价类组成的等价类族,即有: 粗糙集 - 图15.

定义3:粗糙集 - 图16.分类价IND(D)关于条件属性C的正域(简称D的C正域)定义为:

粗糙集 - 图17

其中,粗糙集 - 图18包含了U中所有能被C正确分类为粗糙集 - 图19中一类的对象. D在C上的依赖度定义为:粗糙集 - 图20 —个属性粗糙集 - 图21,如果粗糙集 - 图22,则称为a为可去除的;否则称为不可去除的。 属性粗糙集 - 图23集称为C的一个约简,如果满足以下条件:粗糙集 - 图24. 一个条件属性C的约简是具有同C相同分类能力的一个C的子集,并且约简中的任意一个属性都不能在不降低其分类能力的前提下被删除。

算法应用

粗糙集理论能够提供有效的技术用于数据挖掘的数据预处理、数据缩减、规则生成、数据依赖关系发现等方面,故该理论目前作为数据挖掘领域的一种主流方法,也正受到越来越多研究者的关注,并开始被广泛应用于数据挖掘、机器学习、决策支持系统和模式识别等众多领域。粗糙集主要用于特征归约,能识别和删除无助于给定训练数据分类的属性,提炼出重要属性和约简属性集。

优缺点

优点:

  1. 除数据集外,无需任何先验知识(或信息)
  2. 对不确定性的描述和处理相对客观

缺点:

  1. 缺乏处理不精确或不确定原始数据的机制
  2. 对含糊概念的刻画过于简单
  3. 无法解决所有含糊的、模糊的不确定性问题