艾巴生活网

您现在的位置是:主页>科技 >内容

科技

模糊聚类分析及其应用(模糊聚类算法及应用分析)

2024-09-21 13:04:55科技帅气的蚂蚁
聚类是从给定的数据集中搜索数据对象之间有价值的数据分布模式。要解决的主要问题是如何在没有先验知识的情况下实现聚类和聚集。聚类分析广

模糊聚类分析及其应用(模糊聚类算法及应用分析)

聚类是从给定的数据集中搜索数据对象之间有价值的数据分布模式。要解决的主要问题是如何在没有先验知识的情况下实现聚类和聚集。聚类分析广泛应用于金融数据分析、空间数据处理、卫星图像分析等领域。笔者在对我校中期教学检查中学生所做的问卷调查数据进行分析的基础上,根据模糊聚类分析的结果给出了教师教学效果的评价[1]。

1.模糊聚类分析在模糊聚类中,每个样本不再属于某一类,而是属于具有一定隶属度的每一类。也就是说,通过模糊聚类分析,得出样本属于各种不确定度,建立样本对于类别的不确定性描述,可以更准确地反映展示世界。模糊聚类不需要训练样本,直接通过机器学习就可以实现自动分类。模糊聚类不仅可以直接从原始数据中提取特征,还可以对获得的特征进行优化降维,避免“维数灾难”。常用的模糊聚类算法包括:模糊C均值算法、基于划分的聚类方法等。

1.1标定(建立模糊相似矩阵)(1)设样本集X=(x1,x2,…,xn),n为样本数。让每个样本xi由一组特征数据(xi1,xi2,xim)。为了比较不同维度的实际问题中的不同数据,通常会对实测数据进行以下两种方式的变换,将数据压缩到[0,1]区间。

(2)模糊相似矩阵R的建立主要是确定其相似系数rij,即xi与xj的相似程度。求相似系数rij的方法有很多,常见的有:

1.2聚类(对样本集进行分类)首先,定义矩阵的模糊乘法“O”运算规则如下:

2.模糊聚类分析的应用2.1数据收集本例来自吉林建筑工程学院计算机学院2008-2009学年第一学期学生对教师课堂教学的问卷调查数据。参与调查的老师都是本学期教计算机专业课的老师,近500名学生参与了这项活动。被调查的课程包括数字逻辑、多媒体技术、高等数学、计算机微观接口、数学建模、网络安全和计算机组成原理。从教书育人、备课充分性、讲课知识量、突出重点、课堂互动、教学内容新颖性、多媒体技术运用等方面对教师进行授课,每项满分10分。

2.2相似度矩阵的建立通过对学生的调查结果进行统计分析,建立模糊相似度矩阵。在这个例子中,夹角余弦法用于计算相似系数RIJ [4-6]。计算相似矩阵见表1。

2.3聚类用直接聚类法做一个动态聚类图(如图1)。从这种图中可以得到样本聚类的结果,即当学生评价教师教学的样本分为三类时,聚类如下:

{1,2,3,5},{6,10},{4,7,8,9}。

聚类分析的原理是:先聚类的样本相似度高。在这个例子中,rij是相似系数。从动态聚类过程可以看出,聚类成三类时,一类样本1、2、3、5是要求严格,善于管理,教书育人并重;备课充分,课程内容娴熟,富有讲课精神;认真批改作业,及时辅导答疑;讲课有吸引力,能激发学生的兴趣,课堂气氛活泼雷同,说明教师的责任心和个人素质高;类样本6和10深入浅出地解释问题,思路清晰,有启发性;能给学生类似思维、联想、创新的启发,说明教师可以把创新思维方式引入教学过程。三类样本4、7、8、9讲课内容充实,信息量大,重点突出;碲

3.结论聚类分析是一种非常有用的数据挖掘技术。在聚类分析过程中,可以给出分类数,但不能给出分类标准。同时,如果rij的计算方法不同,同样的样本也可能得到不同的聚类结果。因此,在实际应用中,聚类分析应结合实际问题,从而选择rij的计算方法。教师教学质量聚类分析不能给出传统意义上的教师讲课顺序,但能很好地实现评价的诊断功能,为今后选择评价项目和指标提供依据,充分发挥评价体系的激励功能,促进教师教学质量和整体教学水平的提高。