机器学习推荐系统1.目的,思想,数据来源
最近在看尚硅谷大数据中的教程,讲到了spark机器学习推荐系统。就分层记录一下。
推荐系统的目的
• 信息过载
• 推荐系统
• 推荐系统是信息过载所采用的措施,面对海量的数据信息,
从中快速推荐出符合用户特点的物品。解决一些人的“选择
恐惧症”;面向没有明确需求的人。
• 解决如何从大量信息中找到自己感兴趣的信息。
• 解决如何让自己生产的信息脱颖而出,受到大众的喜爱。
推荐系统的目的
好的推荐系统——让三方共赢
• 让用户更快更好的获取到自己
需要的内容
• 让内容更快更好的推送到喜欢
它的用户手中
• 让网站(平台)更有效的保留
用户资源
推荐系统的基本思想
• 利用用户和物品的特征信息,给用户推荐那些具有用户喜欢的特征的物品。
• 利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品。
• 利用和用户相似的其他用户,给用户推荐那些和他们兴趣爱好相似的其他用户喜欢的物品
图片:
推荐系统的数据分析
• 要推荐物品或内容的元数据,例如关键字,分类标签,基因描述等;
• 系统用户的基本信息,例如性别,年龄,兴趣标签等
• 用户的行为数据,可以转化为对物品或者信息的偏好,根据应用本身的不同,
可能包括用户对物品的评分,用户查看物品的记录,用户的购买记录等。这些用户的偏好信息可以分为两类:
– 显式的用户反馈:这类是用户在网站上自然浏览或者使用网站以外,显式的提供
反馈信息,例如用户对物品的评分,或者对物品的评论。
– 隐式的用户反馈:这类是用户在使用网站是产生的数据,隐式的反应了用户对物
品的喜好,例如用户购买了某物品,用户查看了某物品的信息等等
也就是推荐系统的数据源来自:用户,物品,用户的行为数据。
其中显示反馈是从业务系统数据库中获取的
隐式反馈是从日志中获取的
带尺寸的图片:
居中的图片:
居中并且带尺寸的图片:
当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。
如何插入一段漂亮的代码片
去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片
.
// An highlighted block
var foo = 'bar';
生成一个适合你的列表
- 项目
- 项目
- 项目
- 项目
- 项目1
- 项目2
- 项目3
- 计划任务
- 完成任务
创建一个表格
一个简单的表格是这么创建的:
项目 | Value |
---|---|
电脑 | $1600 |
手机 | $12 |
导管 | $1 |
设定内容居中、居左、居右
使用:---------:
居中
使用:----------
居左
使用----------:
居右
第一列 | 第二列 | 第三列 |
---|---|---|
第一列文本居中 | 第二列文本居右 | 第三列文本居左 |
SmartyPants
SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:
TYPE | ASCII | HTML |
---|---|---|
Single backticks | 'Isn't this fun?' |
‘Isn’t this fun?’ |
Quotes | "Isn't this fun?" |
“Isn’t this fun?” |
Dashes | -- is en-dash, --- is em-dash |
– is en-dash, — is em-dash |
创建一个自定义列表
- Markdown
- Text-to-HTML conversion tool
- Authors
- John
- Luke
如何创建一个注脚
一个具有注脚的文本。1
注释也是必不可少的
Markdown将文本转换为 HTML。
KaTeX数学公式
您可以使用渲染LaTeX数学表达式 KaTeX:
Gamma公式展示 是通过欧拉积分
你可以找到更多关于的信息 LaTeX 数学表达式here.
新的甘特图功能,丰富你的文章
- 关于 甘特图 语法,参考 这儿,
UML 图表
可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:
这将产生一个流程图。:
- 关于 Mermaid 语法,参考 这儿,
FLowchart流程图
我们依旧会支持flowchart的流程图:
- 关于 Flowchart流程图 语法,参考 这儿.
导出与导入
导出
如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。
导入
如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。
-
注脚的解释 ↩︎
上一篇: 随机森林课题