Deeplearning Algorithms tutorial

谷歌的人工智能位于全球前列,在图像识别、语音识别、无人驾驶等技术上都已经落地。而百度实质意义上扛起了国内的人工智能的大旗,覆盖无人驾驶、智能助手、图像识别等许多层面。苹果业已开始全面拥抱机器学习,新产品进军家庭智能音箱并打造工作站级别Mac。另外,腾讯的深度学习平台Mariana已支持了微信语音识别的语音输入法、语音开放平台、长按语音消息转文本等产品,在微信图像识别中开始应用。全球前十大科技公司全部发力人工智能理论研究和应用的实现,虽然入门艰难,但是一旦入门,高手也就在你的不远处! AI的开发离不开算法那我们就接下来开始学习算法吧!

频繁模式增长算法

频繁模式增长算法(Frequent-pattern growth, FP-Growth)是一种挖掘频繁项集的方法。

FP-Growth算法采用分治策略,将提供频繁项集的数据库压缩到一颗频繁模式树(Frequent-pattern tree, FP-tree)上,但仍保留项集的关联信息,通过不断地迭代FP-tree的构造和投影过程来发现频繁模式。

FP-Growth算法将发现长频繁模式的问题转化为递归搜索一些较短模式,然后连接最不频繁项作为后缀;它是Apriori算法的优化处理,克服了Apriori算法在过程中重复地扫描数据库和产生大量的候选项集的问题。

相关应用

频繁模式增长算法采用分治策略,挖掘全部的频繁项集但不产生候选。该算法应用广泛,如可用在保险领域、生物学领域、地震研究等领域中。

具体的如可用于消费市场价格分析,猜测顾客的消费习惯;网络安全领域中的入侵检测技术;可用在用于高校管理中,根据挖掘规则可以有效地辅助学校管理部门有针对性的开展贫困助学工作;也可用在移动通信领域中,指导运营商的业务运营和辅助业务提供商的决策制定等。

优缺点

优点:在发现频繁模式时,不会产生候选集,从而提升算法的速度

缺点:整体上FP-tree算法在空间消耗挺大