推荐系统召回算法:基于用户的协同过滤(UserCF) 1. 算法原理如果用户 A 和用户 B 的兴趣相似,而其中一位用户对某个物品感兴趣,那么另一位用户也很有可能对这个物品感兴趣。这就是基于用户的协同过滤(UserCF)算法的基本思想。 那么,推荐系统如何知道用户 A 和用户 B 的兴趣相似呢?例如: 思路 1:如果用户 A 喜欢的物品和用户 B 喜欢的物品有很多重合(或者说点击、点赞、收藏、转发等行为有很多重合),那么用户 A 和用户 B 的兴趣 2023-05-05 推荐系统 #协同过滤 #召回算法 #UserCF
推荐系统召回算法:Swing 算法 Swing 算法广泛用于推荐系统的召回阶段,本文将介绍 Swing 算法的原理和实现。 1. ItemCF 算法可能存在的一个问题ItemCF 算法在计算两个物品的相似性时认为:两个物品的受众重合度越大,两个物品的相似度越大。但是这种假设在实际应用中可能存在“小圈子”问题,举例来说:当两个不太相似的物品被转发到同一个微信群中时,这两个物品同时被群友点击,这样就会导致这两个物品的相似度很高,但是这两 2023-04-20 推荐系统 #Swing #召回算法
推荐系统召回算法:基于物品的协同过滤(ItemCF) 1. 算法原理如果用户喜欢物品 A,而物品 A 和物品 B 有很高的相似度,那么用户很有可能也喜欢物品 B。这就是基于物品的协同过滤(ItemCF)算法的基本思想。 例如,某位用户喜欢看《三国演义》,而《三国演义》和《水浒传》有很高的相似度,那么这位用户很有可能也喜欢看《水浒传》,如果用户没有看过《水浒传》,那么我们就可以推荐给用户看《水浒传》。 那么,推荐系统如何知道《三国演义》和《水浒传》有很 2023-04-20 推荐系统 #协同过滤 #召回算法 #ItemCF
推荐系统召回算法:基于物品属性的倒排索引召回 1. 算法简介顾名思义,基于物品属性的召回方法的基本思想是根据某一物品属性,召回与之匹配的相关物品。例如在 UGC 图文内容推荐场景中,我们可以根据物料的类型、标签、话题等属性快速找到相关物料;在电商推荐场景中,我们可以根据物品的类目、品牌、价格等信息快速召回相关物品。 在实际应用中,需要事先通过离线计算将具备相同属性的物品放入同一个集合中,集合内部按照后验消费指标(例如 CTR,停留时长)降序排 2023-04-20 推荐系统 #召回算法 #倒排索引
推荐系统中常用的召回方法总结 本文汇总了推荐系统中常用的召回方法,分篇记录如下,供自己学习使用: 1. 传统召回算法 基于物品属性的倒排索引召回 基于物品的协同过滤(ItemCF) Swing 算法 基于用户的协同过滤(UserCF) (TODO)矩阵分解算法 2. 基于向量的召回算法 (TODO)FM 算法 (TODO)Item2Vec 算法 (TODO)Airbnb 算法 (TODO)YouTubeDNN 算法 (TOD 2023-04-19 推荐系统 #召回 #协同过滤 #Swing #矩阵分解 #FM #Item2Vec #Airbnb #YouTubeDNN #双塔召回 #EGES #GraphSAGE #PinSAGE #MIND #SDM #TDM
常见的距离度量方法 1. 欧式距离 (Euclidean Distance)欧式距离是最常见的距离度量方法,它的定义如下: $$d(x, y) = \sqrt{\sum_{i=1}^n (x_i - y_i)^2}$$ 其中,$x$ 和 $y$ 是两个向量,$x_i$ 和 $y_i$ 是向量 $x$ 和 $y$ 的第 $i$ 个元素,$n$ 是向量 $x$ 和 $y$ 的维度。 举例来说,假设 $ 2023-03-28 #欧式距离 #曼哈顿距离 #切比雪夫距离 #闵可夫斯基距离 #余弦相似度 #杰卡德相似系数 #皮尔逊相关系数 #汉明距离 #编辑距离
Docker 入门教程 1. 概述1.1 Docker 是什么Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。 Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。 容器是完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 app), 更重要的是容器性能开销极低。 1.2 2023-02-28 #Docker
位运算技巧总结 1. 位运算的性质 x对其自身运算 x & x = x x | x = x x ^ x = 0 x与0运算 x & 0 = 0 x | 0 = x x ^ 0 = x x与0运算 x & (0) = x x | (0) = ~0 x ^ (0) = ~x 异或的性质 x ^ 0 2023-02-27 数据结构与算法 #位运算
最大公约数与最小公倍数 最大公约数(Greatest Common Divisor)最大公约数,也称最大公因数、最大公因子,指两个或多个整数共有约数中最大的一个。a,b的最大公约数记为 $(a,b)$,同样的,a,b,c 的最大公约数记为 $(a,b,c)$,多个整数的最大公约数也有同样的记号。[1] 举例:12 与 18 的最大公因数为多少? 12 的因数有 1,2,3,4,6,12 18 的因数有 1,2,3,6,9 2023-01-30 数据结构与算法 #最大公约数 #最小公倍数
常见的深度学习优化器 本文整理了常见的深度学习优化器,仅供本人学习使用,大部分内容来自于张觉非,陈震《用Python实现深度学习框架》[1],仅做了少量的修正和新增。 梯度下降优化器梯度下降算法的基本原理:将样本视为常量,将参数视为自变量,将损失值视为因变量,然后计算损失值对参数的梯度。经典的梯度下降算法可以根据训练样本的选取方式不同分为如下三种: BGD(Batch Gradient Descent,批量梯度下降法 2023-01-11 机器学习 #优化器 #梯度下降 #SGD #Adam