Spark商务推荐系统论文范文提纲

2022-04-10 17:21 1048 浏览

Spark商务推荐系统论文范文提纲--基于Spark的商户推荐系统的设计与实现

摘要:随着信息技术的发展,互联网为人们的日常生活带来了诸多便利,人们可以通过互联网随时随地的浏览、获取信息。互联网为我们带来便利的同时,也带来了海量的数据信息。面对海量的数据信息,用户无法快速准确的定位感兴趣的信息,造成了数据冗余问题。本论文基于此背景,设计并实现了一款基于Spark的商户推荐系统,帮助用户过滤出感兴趣的商户信息,解决海量商户数据造成的数据冗余问题。系统整体采用模型/视图/控制器(MVC)三层架构设计模式,开发框架选择Spring Boot完成Web应用的开发。Spring Boot内部集成的Spring MVC框架进行前后端的控制转发,My Batis同主业务数据库做映射,保存、读取推荐结果,推荐结果最终通过前端页面呈现给系统用户。系统的核心是推荐功能,推荐功能采用Spark分布式计算框架进行开发实现。系统内设计实现了离线、实时两个推荐功能。离线推荐功能内包括:基于内容的离线推荐、基于隐语义模型的离线推荐、基于统计的热门内容推荐三个模块。基于内容的离线推荐模块,通过计算标签信息的权重值,构建用户、物品画像进行推荐,因为系统内物品信息较于用户信息更加的稳定,基于内容的推荐模块十分适用于系统的冷启动期。基于隐语义模型的离线推荐模块结合用户行为矩阵进行评分预测。区别于单纯的基于内容推荐,这一模块利用评分信息,能够侧面的反应物品的质量优劣,推荐结果优于基于内容的离线推荐模块。基于统计的热门内容离线推荐模块配置Mongo DB连接信息,连接主业务数据库,获取数据库中数据信息。这一模块基于数量统计直接查询数据库内数据得到推荐结果,得到的推荐结果同用户的历史行为数据重叠度低,能够挖掘更多的用户信息,丰富用户画像。实时推荐功能内包括基于近k次评分的实时推荐、基于内容的实时推荐两个模块。基于近k次评分的实时推荐模块内,实现了一种结合评分和相似度的推荐优先级计算算法,该模块直接利用基于隐语义模型离线推荐模块产出的相似度信息进行计算,大大的节省了运行时间。基于内容的实时推荐模块获取基于内容的离线推荐模块中产出的相似度信息进行推荐,满足实时场景下的基于内容推荐。离线、实时两个推荐功能基于混合推荐的机制进行联动,可以应用于不同的推荐场景。系统目前已经通过了各项测试指标,能够在稳定运行的基础上,满足用户不同场景下的使用需求。

关键词:商户推荐;Spark;SpringBoot;推荐系统;协同过滤;隐语义模型;

中文摘要

ABSTRACT

1 绪论

    1.1 论文工作背景及意义

    1.2 国内外发展现状

    1.3 论文的相关工作

    1.4 论文的组织结构

2 相关技术概述

    2.1 大数据相关技术概述

        2.1.1 HDFS

        2.1.2 Flume

        2.1.3 Kafka

    2.2 推荐系统中的相似度计算

        2.2.1 余弦相似度计算

        2.2.2 皮尔逊相似度计算

    2.3 主流推荐算法概述

        2.3.1 基于内容的推荐算法

        2.3.2 基于用户的协同过滤推荐算法

        2.3.3 基于物品的协同过滤推荐算法

    2.4 本章小结

3 系统需求分析

    3.1 系统可行性分析

    3.2 系统建设目标

    3.3 系统功能性需求分析

    3.4 系统非功能性需求分析

    3.5 本章小结

4 系统概要设计

    4.1 系统总架构设计

    4.2 系统推荐功能Spark框架设计

        4.2.1 RDD弹性数据集在系统推荐功能中的运用

        4.2.2 系统应用Spark框架的优势

        4.2.3 推荐功能中的混合推荐机制

    4.3 系统功能结构设计

    4.4 系统数据库结构设计

    4.5 本章小结

5 系统详细设计

    5.1 系统推荐功能结构设计及系统的数据加载

        5.1.1 系统推荐功能结构设计

        5.1.2 系统的数据加载

    5.2 基于内容的离线推荐模块

    5.3 基于隐语义模型的离线推荐模块

        5.3.1 基于隐语义模型的推荐算法设计

        5.3.2 基于隐语义模型的离线推荐模块的设计实现

    5.4 基于统计的热门内容离线推荐模块

    5.5 基于近k次评分的实时推荐模块

        5.5.1 基于近k次评分的实时推荐模块算法设计

        5.5.2 基于近k次评分的实时推荐模块的设计实现

    5.6 基于内容的实时推荐模块

    5.7 本章小结

6 系统测试

    6.1 推荐系统主流测试策略

    6.2 系统的推荐功能测试指标

        6.2.1 评分预测类测试指标

        6.2.2 TopN类推荐测试指标

    6.3 系统的推荐功能测试

        6.3.1 推荐功能测试结果分析

        6.3.2 系统的推荐功能测试小结

    6.4 系统功能性测试

        6.4.1 首页功能测试

        6.4.2 详情页功能测试

    6.5 本章小结

7 总结与展望

    7.1 论文总结

    7.2 工作展望

参考文献


相关内容
  • 软件工程硕士论文范文提纲
    软件工程硕士论文范文提纲---嵌入式ERP同步校正采集系统摘要:与事件相关的电位(EventrelatedPotentials,ERP)是一种脑电图信号的诱发电位,是一种由外部刺激引起的脑电图电位。与事件相关的电位反映了人体对外部刺激的认知过程,因此也称为认知电位。ERP信号主要观察时域的波形变化,需要准确记录时域波形检测中刺激信号出现的位置,便于后期数据分析。近年来,由于多任务操作系
  • 视觉语言导航系统路径决策论文提纲
    视觉语言导航系统路径决策论文提纲---视觉语言导航系统的路径决策多模态算法研究与实现摘要:视觉语言导航是一项集计算机视觉和自然语言处理于一体的跨模态任务。该任务要求模型转换和处理图像和自然语言两种不同格式的信息,获取信息,并在模拟的真实3D环境中完成导航任务。目前,大多数相关研究倾向于通过更好地处理图像和自然语言信息或改进导航算法来提高视觉语言
  • 威胁情报论文范文提纲
    威胁情报论文范文提纲--基于ScyllaDB的威胁情报平台设计与实现摘要:近年来,随着网络安全事件的不断发生,网络威胁攻击事件逐渐倾向于有组织、有规模的形式。威胁情报在网络安全领域尤为重要。它通常可以从威胁情报中与更多的相关威胁情报和事件信息相关联。基于多年积累的丰富的情报数据和成熟的技术,作者实习部门建立了数据量大、数据准确的高性能威胁情报平台,积
  • 软件工程好写硕士论文题目50个
    软件工程好写硕士论文题目50个1以太坊平台实体识别系统的研究与设计   2北京地铁气象预警系统的设计与实现   3科技类文本翻译中连贯与衔接的处理 4基于能力素质模型的H公司研发人员招聘体系改进研究   5高温熔融沉积3D打印设备设计及软件开发   6E公司软件研发人员沟通能力提升策略研究   7基于STM32的温室环境监测和控制系统   8S公
  • 软件工程硕士论文提纲框架
    软件工程硕士论文提纲框架---证券市场风险分析平台的设计与实现摘要:伴随着经济的高速增长以及整个金融行业信息化浪潮的到来,证券业务也随之进入“大数据”时代,证券行业逐渐成为一种高智力,高收益,高科技的行业。然而,随着全球化经济的不断渗透,证券市场因国际资本的流动而显得变幻莫测,证券行业中的各类风险也随之变得复杂和难以把控,因此怎样去分析并预测风险成为证
相关推荐
热门内容
  • 东方甄选SWOT分析战略
    东方甄选是一家专注于高品质商品的电商平台。进行其SWOT分析可以帮助识别其内部优势(Strengths)和劣势(Weaknesses),以及外部机会(Opportunities)和威胁(Threats)。以下是基于一般情况的东方甄选SWOT分析:优势(Strengths)品质保证:东方甄选可能注重商品的品质,为消费者提供高质量的商品。精准定位:面向追求高品质生活的消费群体,定位清晰。品牌形象:可能建立了良好的品
  • 党史党建论文题目105个
     1.习近平新时代中国特色社会主义思想创立的历史考察,党史·党建 2.习近平总书记关于党史、国史的重要论述研究,党史·党建 3.习近平总书记关于大力弘扬“红船精神”等革命精神的重要论述研究,党史·党建 4.习近平新时代中国特色社会主义思想中加强党的全面领导思想研究,党史·党建 5.习近平新时代中国特色社会主义思想中全面从严治党思想研究,党史·党
  • 数字经济论文好写题目推荐50个
    数字经济论文好写题目推荐50个1“双循环”新发展格局下产业链升级机遇、挑战和路径选择    2从数字经济看自由主义的局限性   3我国数字贸易发展策略研究    4卖空机制如何影响企业数字化转型——理论机制分析与实证检验    5数字巨头跨界扩张的竞争法挑战与应对    6数字经济下的杭州丝绸企业品牌营销转型升级研究   7数字时代推进共
  • 平台效应论文
    关键词: 平台效应;主播效应;感知有用性;摘要: 由于新冠疫情发生,促使电商直播购物方式迅速发展。为助力电商直播的发展,从主播和平台两个方面出发,基于感知–情感–行为意愿(CAC)模型,并以感知有用性和满意度作为中介变量,构建消费者持续使用意愿影响研究模型,并通过问卷调查和结构方程模型进行实证研究。结果表明:主播和平台两个方面对消费者感知有用性和满意
  • 消费者需求论文,市场状况论文
    关键词: 紧平衡;消费者需求;市场状况;供应定位;精准营销;工业和商业摘要: 在“互联网+”和烟草行业信息化水平不断发展的大背景下,经济发展的市场化和国际化迫使中国烟草行业直面严厉的挑战。粗犷的商业投放模式和营销方式,无法适应当今快速变化的互联网市场环境,导致消费者难以挑选到心仪的产品,而企业也无法把适当的产品投向对应的市场,更无从市场导向控制
联系方式
  • 13384015218
  • 13384015218
  • 921006691@qq.com