基于集成回归的个性化推荐算法

当前位置：发明专利>基于集成回归的个性化推荐算法

基于集成回归的个性化推荐算法

　本发明公开了一种基于集成回归的个性化推荐算法，其特征在于，包括以下步骤：步骤1：获取用户数据集，将用户数据集中每一个用户归为一个样本，遍历样本列表，记录样本的总数量N，并给每一个样本赋上初始权重d₀；步骤2：集成若干个基础推荐算法，形成弱学习器选择池，并生成基础推荐算法列表k等步骤。本发明通过集成多个不同的基础推荐算法形成涵盖了各种不同影响因子的强学习器来解决同一个问题，提高了推荐系统的泛化能力，进而提升最终的推荐准确率。

基础信息

申请公布号: CN110297978A

申请公布日: 2019.10.01

申请号: 2019105734589

申请日: 2019.06.28

申请人: 四川金蜜信息技术有限公司

地址: 610000四川省成都市中国（四川）自由贸易试验区成都高新区天泰路112号12层

发明人: 琚生根; 李思骏; 周志钢; 李磊; 胡思才

Int. Cl.: G06F16/9535(2019.01)I; G06F16/9536(2019.01)I; G06Q30/06(2012.01)I

专利代理机构: 成都三诚知识产权代理事务所(普通合伙)51251

代理人: 成实; 饶振浪

摘要附图

权利要求书

1 .一种基于集成回归的个性化推荐算法，其特征在于，包括以下步骤：步骤1 ：获取用户数据集，将用户数据集中每一个用户归为一个样本，遍历样本列表，记录样本的总数量N，并给每一个样本赋上初始权重d0；

步骤2：集成若干个基础推荐算法，形成弱学习器选择池，并生成基础推荐算法列表；

步骤3：根据样本的初始权重进行迭代运算生成一个弱学习器，并将生成的弱学习器从弱学习器选择池中挑出，每一次迭代运算所挑出的弱学习器集合成弱学习器集；

步骤4：根据弱学习器对样本的权重进行更新，以更新后的权重作为下一次迭代的样本权重；

步骤5：根据生成的弱学习器产生强学习器；

步骤6 ：通过该强学习器对用户项目进行评级，评级高的则作为推荐对像，得出推荐结果。

2 .根据权利要求1所述的一种基于集成回归的个性化推荐算法，其特征在于，所述步骤3中生成弱学习器包括以下步骤：(1) 计算每个样本的误差值erri ；其中，|ui|为用户ui所介入的项目数量，l表示用户ui所评价项目的编号，t为当前的迭代次数，i为样本序号，hkt (xil) 表示弱学习器选择池中第k个基础推荐算法在第t次迭代中对样本的评级预测值，yil表示第i个用户所对应的第l个项目的用户评级；

(2) 根据样本的误差值erri计算出弱学习器选择池中每个基础推荐算法的误差值ξkt ，并将误差值最小的基础推荐算法从弱学习器选择池中挑出作为本次迭代的弱学习器；其中，ξk t ＝ ∑ i d i ，t - 1 f (e r r i) ，d i ，t - 1 为第 i 个样本在第 t - 1 次迭代时所获得的权重，3 .根据权利要求2所述的一种基于集成回归的个性化推荐算法，其特征在于，所述步骤4中包括以下步骤：A 、计算所生成的弱学习器针对用户 u 的代价函数 R t ( u i ) ，计算公式为：B、计算所生成的弱学习器的边界γt，计算公式为：其中，-1≤γt≤1 ，di ,t-1为第i个样本第t-1次迭代运算所获得的权重；

C、挑选出所有迭代过程中产生的弱学习器中最小的边界作为弱学习器集的边界；其中，γt*＝min(γt ,γt-1*) ；

D、对样本权重进行更新，得到样本权重dt，并以更新后的样本权重作为下一次迭代的样本权重；其中：for：1≤j≤t，dit表示第i个样本在第t次迭代时的权重，di0表示第i个样本的初始权重，为弱学习器边界参数，v为样本权重参数，Rj(ui)表示第j次迭代所生成的弱学习器对用户u的代价函数；当的解为空集时，终止运算，并以第t-1次迭代运算所生成的候选强学习器作为强学习器。

4 .根据权利要求3所述的一种基于集成回归的个性化推荐算法，其特征在于，所述步骤5中生成强学习器包括以下步骤：a、根据拉格朗日对偶性得出样本的最大间隔ζt*；其中，ζt*＝γt*；

b、计算本次迭代所生成的弱学习器的权重ω；其中：δi表示样本的松弛变量，ωj表示第j次迭代时生成的弱学习器的权重，c、计算该次迭代过程中的候选强学习器Ht(xi) ，所有迭代运算所生成的候选强学习器则集合成候选强学习器集；其中：hj (xi) 表示第j次迭代生成的弱学习器；

d、计算该次迭代过程中生成的候选强学习器的误差Et(x) ；其中：M为用户项目对数量，y(xi)表示第i个样本对应的真实评级信息；

e、计算该候选强学习器的松弛向量第t个分量否则其中，如果Et (x) ＞Et-1 (x) ，则