本发明公开了一种基于集成回归的个性化推荐算法,其特征在于,包括以下步骤:步骤1:获取用户数据集,将用户数据集中每一个用户归为一个样本,遍历样本列表,记录样本的总数量N,并给每一个样本赋上初始权重d0;步骤2:集成若干个基础推荐算法,形成弱学习器选择池,并生成基础推荐算法列表k等步骤。本发明通过集成多个不同的基础推荐算法形成涵盖了各种不同影响因子的强学习器来解决同一个问题,提高了推荐系统的泛化能力,进而提升最终的推荐准确率。
1 .一种基于集成回归的个性化推荐算法,其特征在于,包括以下步骤:步骤1 :获取 用户数据集 ,将 用户数据集中每一个 用户归为一个样本 ,遍历样本列表 ,记录样本的总数量N,并给每一个样本赋上初始权重d0;
步骤2:集成若干个基础推荐算法,形成弱学习器选择池,并生成基础推荐算法列表;
步骤3:根据样本的初始权重进行迭代运算生成一个弱学习器,并将生成的弱学习器从弱学习器选择池中挑出,每一次迭代运算所挑出的弱学习器集合成弱学习器集;
步骤4:根据弱学习器对样本的权重进行更新,以更新后的权重作为下一次迭代的样本权重;
步骤5:根据生成的弱学习器产生强学习器;
步骤6 :通过该强学 习器对 用户项目 进行评级 ,评级高的 则作为推荐对像 ,得出推荐结果。
2 .根据权利要求1所述的一种基于集成回归的个性化推荐算法,其特征在于,所述步骤3中生成弱学习器包括以下步骤:(1) 计算每个样本的误差值erri ;其中 ,|ui|为用户ui所介入的项目数量,l表示用户ui所评价项目的编号,t为当前的迭代次数,i为样本序号 ,hkt (xil) 表示 弱学 习器选择池中 第k个基础推荐算法在第t次 迭代中对样本的 评级预测值,yil表示第i个用户所对应的第l个项目的用户评级;
(2) 根据样本的 误差值erri计算出 弱学 习器选择池中 每个基础推荐算法的 误差值ξkt ,并 将误差值最小的 基础推荐算法从 弱学 习器选择池中 挑出 作为本次 迭代的 弱学 习器 ;其中 ,ξk t = ∑ i d i ,t - 1 f (e r r i) ,d i ,t - 1 为 第 i 个 样 本 在 第 t - 1 次 迭 代 时 所 获 得 的 权 重 ,3 .根据权利要求2所述的一种基于集成回归的个性化推荐算法,其特征在于,所述步骤4中包括以下步骤:A 、计 算 所 生 成 的 弱 学 习 器 针 对 用 户 u 的 代 价 函 数 R t ( u i ) ,计 算 公 式 为 :B、计算所生成的弱学习器的边界γt,计算公式为:其中 ,-1≤γt≤1 ,di ,t-1为第i个样本第t-1次迭代运算所获得的权重 ;
C、挑选出所有迭代过程中产生的弱学习器中最小的边界 作为弱学习器集的边界;其中,γt*=min(γt ,γt-1*) ;
D、对样本权重进行更新,得到样本权重dt,并以更新后的样本权重作为下一次迭代的样本权重;其中:for:1≤j≤t,dit表示第i个样本在第t次迭代时的权重,di0表示第i个样本的初始权重, 为弱学习器边界参数,v为样本权重参数,Rj(ui)表示第j次迭代所生成的 弱学 习器对 用 户u的 代价函数 ;当的解为空集时,终止运算,并以第t-1次迭代运算所生成的候选强学习器作为强学习器。
4 .根据权利要求3所述的一种基于集成回归的个性化推荐算法,其特征在于,所述步骤5中生成强学习器包括以下步骤:a、根据拉格朗日对偶性得出样本的最大间隔ζt*;其中,ζt*=γt*;
b、计算本次迭代所生成的弱学习器的权重ω;其中:δi表示样本的 松弛变量,ωj表示第j次迭代时生成的弱学习器的权重,c、计算该次迭代过程中的候选强学习器Ht(xi) ,所有迭代运算所生成的候选强学习器则集合成候选强学习器集;其中:hj (xi) 表示 第j次 迭代生成的弱学习器;
d、计算该次迭代过程中生成的候选强学习器的误差Et(x) ;其中 :M为用户项目对数量,y(xi)表示第i个样本对应的真实评级信息;
e、计算该候选强学习器的 松弛向量第t个分量否则其中 ,如果Et (x) >Et-1 (x) ,则
相关内容