Deeplearning Algorithms tutorial

谷歌的人工智能位于全球前列,在图像识别、语音识别、无人驾驶等技术上都已经落地。而百度实质意义上扛起了国内的人工智能的大旗,覆盖无人驾驶、智能助手、图像识别等许多层面。苹果业已开始全面拥抱机器学习,新产品进军家庭智能音箱并打造工作站级别Mac。另外,腾讯的深度学习平台Mariana已支持了微信语音识别的语音输入法、语音开放平台、长按语音消息转文本等产品,在微信图像识别中开始应用。全球前十大科技公司全部发力人工智能理论研究和应用的实现,虽然入门艰难,但是一旦入门,高手也就在你的不远处!

AI的开发离不开算法那我们就接下来开始学习算法吧!

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。主要研究计算机怎样模拟或实现人类的学习行为,以获取新的知识和技能,重新组织已有的知识结构,不断的改善自身的性能。

机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。这些算法是一类能从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。简而言之,机器学习主要以数据为基础,通过大数据本身,运用计算机自我学习来寻找数据本身的规律,而这是机器学习与统计分析的基本区别。

机器学习主要有三种方式:监督学习,无监督学习与半监督学习。

CBA

CBA(Classification base of Association)算法是一个基于关联规则进行分类的算法,该算法首先利用Apriori算法挖掘出的关联规则,然后进行分类判断。

CBA算法作为分类算法,它的判断依据是Apriori算法挖掘出的频繁项。如果一个项集中包含预先知道的属性,同时也包含分类属性值,然后计算该频繁项,能否计算出由已知属性推出决策属性的关联规则,如果满足规则的最小置信度的要求,那么可以把频繁项集中的决策属性值作为最后的分类结果。具体的算法细节如下:

1.输入数据记录; 2.对属性值作数字替换,形成类似关联规则算法的事务记录; 3.根据转化的事务记录,进行Apriori算法计算,挖掘频繁项集; 4.输入查询的属性值,找出符合条件的频繁项集(包含查询属性和分类决策属性);如果找到这样的规则,则算分类成功,输出结果。 Apriori使用逐层搜索的迭代方法。首先,通过扫描事务集,累计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合,记为L1。然后用L1寻找频繁2项集的集合L2,依次类推,直到不能再找到频繁k项集。

算法背景

CBA算法是基于Apriori算法基础上,由Liu,Hsu和MA提出来的。主要是对已经挖掘出的关联规则,做分类判断,所以在某种程度上说CBA算法也是一种集成的挖掘算法。

相关应用

CBA算法应用广泛,如可用在保险领域、生物学领域、地震研究等领域中。

如可用于消费市场价格分析,猜测顾客的消费习惯;网络安全领域中的入侵检测技术;可用在用于高校管理中,根据挖掘规则可以有效地辅助学校管理部门有针对性的开展贫困助学工作;也可用在移动通信领域中,指导运营商的业务运营和辅助业务提供商的决策制定等。

优点

优点:分类的准确度较高,在大量数据集上比C4.5更精确。