网页模糊归类算法的应用与实现毕业论文(2)
2014-12-22 02:10
导读:隶属函数采用卡夫曼教授提出的隶属函数确定方法(正态分布模型)确定如下: ① 词频针对“不属于”的隶属函数 ② 词频针对“不太可能属于”的隶属
隶属函数采用卡夫曼教授提出的隶属函数确定方法(正态分布模型)确定如下:
① 词频针对“不属于”的隶属函数
② 词频针对“不太可能属于”的隶属函数
③ 词频针对“不可能属于”的隶属函数
④ 词频针对“很可能属于”的隶属函数
⑤ 频针对“属于”的隶属函数
其中,axyz是训练样本中词语的相对词频;x为样本网页中对应词的统计词频;系数是通过人工评判得到一些特殊点,由待定系数法求出的。
下面就要根据多级模糊综合评判的计算方法与步骤将待归类网页与所有类别的平均参照样本进行一遍计算,得出一组表示该网页与各个类别贴近度的数值。然后按照“最大隶属原则”,将网页划到Vn值最大的对应的类别中;或者用“域值法”,事先确定一个不大于1的域值λ,若Vn