欢迎来到专业的新思文库网平台! 工作计划 工作总结 心得体会 事迹材料 述职报告 疫情防控 思想汇报 党课下载
当前位置:首页 > 范文大全 > 公文范文 > 正文

基于数据挖掘的自动化推荐系统改进ART算法探究

时间:2022-11-27 19:45:15 来源:网友投稿

zoޛ)j香۲LS@E?3]wLy۲۲۲6޸N_tM8Mrբaz)V6~^{^w)rjwfzu{azaz)z޴Vy人物关联式推荐技术。[1]对于这些推荐技术来说,其主要推荐方式分为基于内容的过滤方式和合作过滤方式。每一种方式都有着自身独特的功能。以内容为基础的过滤方式具有简单、有效的优点,能够利用用户兴趣和信息的相似性来过滤信息,但是其存在着过滤关键字库容易过时,不能够及时挖掘出有用的、最新的信息的问题;合作过滤方式可以弥补上一种方式的短板,让用户之间的信息互联,仅仅依靠其中一个用户的数据就可以推荐新的信息给其他用户。但是,在实际运行的过程中,还是存在着一些难以处理的问题。

2.2  基于ART算法的推荐机制总体框架

运用ART神经网络技术,能够预处理用户的个人信息,提取出用户的个性化属性信息并加以分析,根据分析结果再对用户进行相应的分类,从而为用户提供个性化的推荐信息[2]。该自动推荐机制的处理流程包括预处理阶段和在线阶段。图2列出了在线自动化推荐机制的框架图。

在线自动化推荐机制运用了相关技术预处理用户的个人信息资料,当有用户在线发起相应的服务请求时,系统会识别用户的类型信息,从而进行分析并挖掘出用户的兴趣度信息,展现给用户个性化的推荐信息。预处理阶段的主要任务是对用户的属性以及历史交易数据等信息进行分析,在提取数据的操作过程中,可能会发生一些问题,比如出现格式不相容的问题,需要及时处理。预处理的同时推荐信息被存储进知识库,便于系统重复利用。

2.3  关于ART算法的现状分析

对于ART算法来说,其目前的情况是,虽然被广泛用来进行用户聚类,但其本身也存在着一些不足,主要表现在以下两个方面。

(1)属性向量“同或”状态。ART算法进行相似度比较,涉及到最大匹配度节点j*的外权向量Wj*和输入向量x,比较两者和“1”的数量关系,其表達如式(1):

此公式中没有考虑外权向量中“0”的作用,但在实际运用中,0和1两种状态在判断中都是有用的信息,该方法因此不能有效的做出反应[3]。

(2)ART算法中输入属性相对应的权重问题。输入属性是多个属性的集合,每个因子都会对聚类的结果产生不同的影响,为了处理在聚类过程中属性重要性的问题,ART算法仍然需要通过改进才能得到合理的结果。

3  在自动化推荐系统中应用ART网络进行聚类的设计以及改进该算法的研究

自适应共振理论(ART)来源于人工神经网络,人工神经网络(ANN)是一种应用较好的集群技术,其理论基础来源于生物学,是一种模仿生物神经网络的信息处理系统[4]。对于自适应共振理论(ART),其是一位美国学者在1987年提出的一种神经网络模型。通过整合ART以及数据挖掘技术,可以帮助用户在浩大的信息流中找到真正需要的、有用的关键信息。

3.1  在数据挖掘中关于ART算法的聚类设计

ART算法网络的结构包括输入层、输出层和网络连接层。在应用ART算法处理时,第一步要设置好用户属性和其对应的输入向量,其初始向量的范围在(0,1)间;第二步设定其开始时只有一个初始输出点;第三步利用权重矩阵表示出输入向量和第j个输出集的匹配度,然后找到相对应的输出集,计算出两者之间的相似度。

3.2  目前ART聚类算法存在的不足

对于ART聚类算法,目前的情况是虽然被广泛用来进行用户聚类,但其本身也存在着一些不足,主要表现在以下两个方面:对于属性向量“同或”状态的问题,对于典型的相似度比较的问题,没有能够全面的考虑,因此需要进行相关的改进优化。通过整合ART和数据挖掘技术,针对自动化推荐系统的特性进行相应的改进,这时MART算法便应运而出。

3.3  将ART算法改进为MART算法

根据ART算法的相关分析,发现其存在着明显的不足,我们将相似值计算公式修改如式(2)所示:

在改进后的MART算法中,M[i]为输入属性的权重,即第i个节点重要性。ART算法改进后得到的MART算法能够公平比较两个向量,其算法的执行步骤和ART算法类似,根据用户的个人属性,通过相应的算法对用户进行分组,进而达到数据挖掘的目的。

通过相关的实验我们可以得到两种算法经过计算分析后的结果,然后进行相关的分析我们可以发现以MART算法来进行聚类,判断出用户属性的重要性,从而自动化推荐系统可以设置每一个属性节点的权重。把以这样的方式计算出的结果与传统的ART算法得到的结果进行比较,输出的结果更加合理和灵活。

4  结  论

互联网的快速发展使得网络的信息量迅速增长,如何在浩大的数据海洋里搜寻到有价值、有效的数据信息,是各个注重信息价值领域的企业所应该关注的问题。对于数据挖掘技术而言,其主要的价值就是在海量的数据资源里进行分析比较,然后发现有价值的数据信息,再通过一定的自动化推荐系统,把这些有用的数据呈现到用户的面前,从而为用户制定相关的发展策略提供有用的参考。在通信领域采用优质的自动化推荐系统对企业的发展具有至关重要的作用。

参考文献:

[1] 陈庆章,汤仲喆,王凯,等.采用数据挖掘的自动化推荐技术的研究 [J].中文信息学报,2012,26(4):115-121.

[2] 张军.试分析数据挖掘在通信行业营销中的应用 [J].信息通信,2018(7):254-255.

[3] 刘鑫.聚类相似性度量与量纲分析的网络通信数据挖掘算法研究 [J].计算机产品与流通,2018(3):48-49.

[4] 朱文忠.基于数据挖掘的自动化推荐系统算法 [J].四川理工学院学报(自然科学版),2012,25(2):55-59.

作者简介:彭文惠(1981-),女,汉族,湖南宁乡人,讲师、高级工程师,硕士,主要研究方向:大数据、数据库、Web开发。

推荐访问:探究 算法 数据挖掘 改进 自动化