自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(90)
  • 资源 (3)
  • 收藏
  • 关注

原创 【Reinforcement Learning】强化学习常用算法

本篇只介绍QLeaning相关算法。

2025-07-17 20:47:43 1097

原创 【Reinforcement Learning】强化学习基础概述

Reinforcement Learning是机器学习的重要分支,其核心在于‌智能体(Agent)通过与环境的动态交互学习最优决策策略‌,以最大化长期累积奖励。

2025-07-15 17:15:57 1197

原创 【机器学习】保序回归平滑校准算法

保序回归平滑校准算法(SIR)通过分桶合并+线性插值解决广告预估偏差问题,核心是保持原始排序下纠偏。具体步骤:1)按预估分升序分桶,统计每个分桶的后验CTR;2)合并逆序桶重新计算均值,确保Pctr-Actr散点单调递增;3)用分段线性函数拟合校准曲线,保证平滑性。优势在于利用保序思想缓解数据稀疏,兼具轻量化和可解释性,实测提升RPM/CTR/ROI。

2025-07-11 12:59:10 1280

原创 【机器学习】BeamSearch算法

Beam Search是一种启发式搜索算法,常用于自然语言处理和其他需要生成序列的任务中。Beam Search通过维护一个有限大小的候选集(称为“beam”),在每一步只选择最有希望的若干个候选项,从而避免了暴力搜索空间的指数级增长。简言之,Beam Search 会在每个时间步上选择最佳的“beam width”(宽度)个候选,而不是总是选择最好的单个候选。

2025-07-09 20:58:49 386

原创 【Mac】MacOS系统下常用的开发环境配置2025版

【Mac】2025MacOS系统下常用的开发环境配置。

2025-03-03 14:01:57 942

原创 【推荐算法】MMoE模型:Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts

MMoE是谷歌在2018年发表在KDD上的一篇基于多任务学习的经典论文,其使用场景是对不相关任务的多任务学习。在推荐系统中,这些不相关的任务可以示例为:视频流推荐中的CTR、时长、点赞、分享、收藏、评论等相关性不强的多个任务。

2022-12-22 20:49:34 4740

原创 【机器学习】Reinforcement Learning-强化学习基础算法

强化学习(Reinforcement Learning, RL),又称增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。...

2022-01-28 17:40:19 4338

原创 【Mac】MacOS系统下常用的开发环境配置

基于Mac系统的常用开发环境配置系统版本:11.3.1 (20E241)

2021-07-20 21:17:48 4208 1

原创 【推荐算法】DSSM双塔模型:Deep Structured Semantic Models for Web Search using Clickthrough Data

DSSM,全称Deep Structured Semantic Model,就是我们通常所说的双塔模型,是微软公司提出的一种基于深度网络的语义模型,其核心思想是将query和doc映射到到共同维度的语义空间中,通过最大化query和doc语义向量之间的余弦相似度,从而训练得到隐含语义模型,达到检索的目的。DSSM有很广泛的应用,比如:搜索引擎检索,广告相关性,问答系统,机器翻译等。

2021-06-17 11:27:45 6545 1

原创 【推荐算法】DeepFM模型:A Factorization-Machine based Neural Network for CTR Prediction

DeepFM模型是由哈尔滨工业大学和华为实验室联合提出的,将FM模型结构与Wide&Deep模型进行了融合。DeepFM可以同时提取低阶组合特征与高阶组合特征。其中,FM模型负责提取一阶特征以及两两交叉特征;DNN模型负责提取高阶特征。相比于谷歌最新的Wide&Deep模型,DeepFM模型的Deep component和FM component从Embedding层共享数据输入,同时不需要专门的特征工程,在推荐系统中取得了不错的推荐效果。

2021-06-03 14:51:03 3978 3

原创 【Algorithm】经典的最长序列算法综述

1、最长公共子序列LCS(longest common sequence)2、最长递增子序列LIS(longest increasing subsequence)

2021-06-01 11:17:50 929 1

原创 【推荐算法】FM模型:Factorization Machines

FM算法是一种基于矩阵分解的机器学习算法,是为了解决大规模稀疏数据中的特征组合问题。在传统的线性模型如LR中,每个特征都是独立的,如果需要考虑特征与特征之间的交互作用,可能需要人工对特征进行交叉组合;非线性SVM可以对特征进行kernel映射,但是在特征高度稀疏的情况下,并不能很好地进行学习;现在也有很多分解模型Factorization Model如矩阵分解MF、SVD++等,这些模型可以学习到特征之间的交互隐藏关系,但基本上每个模型都只适用于特定的输入和场景。为此,FM出现了。

2021-05-17 11:41:09 5444 3

原创 【机器学习】推荐系统、机器学习面试题整理

推荐系统、机器学习常见面试题整理。

2021-05-10 23:18:50 3324

原创 【Algorithm】彻底解释三种背包问题

背包问题背包问题是一类经典的动态规划问题,本文先对背包问题的几种常见类型作一个总结,期望可以用一套框架解决背包问题。这里先简单说说动态规划。动态规划与分治法类似,都是把大问题拆分成小问题,通过寻找大问题与小问题的递推关系,解决一个个小问题,最终达到解决原问题的效果。但不同的是,分治法在子问题和子子问题等上被重复计算了很多次,而动态规划则具有记忆性,通过填写表把所有已经解决的子问题答案纪录下来,在新问题里需要用到的子问题可以直接提取,避免了重复计算,从而节约了时间,所以在问题满足最优性原理之后,用

2021-05-10 15:19:51 871

原创 【推荐系统】推荐系统中一些常用的技术方法

本文主要总结了一些推荐系统中用来解决实际问题常用的技术方法。1、威尔逊区间平滑威尔逊区间平滑可以用来修正item的点击率CTR。Click-Through-Rate,即点击率,是推荐系统中一项重要的衡量指标。原始的CTR计算公式:CTR = 点击数 / 曝光数。这样的计算方式只考虑了相对值,没有考虑绝对值,即没有考虑曝光的数值大小。因为,在曝光很少的情况下,计算出的CTR并不真实可靠,而样本数越大,CTR的比例才越准确,更能反应真实情况。举个例子,有三个广告:A:点击数5...

2021-04-29 11:31:44 4128

原创 【Linux】阿里巴巴图学习框架Euler源码单机安装教程

系统版本:Ubuntu 16.04Euler目前开源的版本是Euler2.0,仅支持Python2,所以在安装的时候,为了避免不必要的坑,将系统的python版本设置成python2.7以上,这里以python2.7.12为例。(pip的版本要与python的版本对应)安装参考:Euler2.0编译安装尝试过从PyPI安装,貌似遇到了一些问题,弃掉从编码编译安装。(直接pip安装的那个是为了单机用户准备的,所以没有编译hdfs的部分)。具体安装流程:1、获取源码git clon...

2020-12-09 10:46:24 785

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(12-TensorFlow计算加速)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第12章TensorFlow计算加速部分样例代码。

2020-11-18 19:43:31 390

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(11-TensorBoard可视化)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第11章TensorBoard可视化部分样例代码。

2020-11-18 19:35:01 289

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(10-TensorFlow高层封装)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第10章TensorFlow高层封装部分样例代码。

2020-11-18 17:59:11 321 2

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(09-自然语言处理)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第9章自然语言处理部分样例代码。

2020-11-18 17:47:30 374

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(08-循环神经网络)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第8章循环神经网络部分样例代码。

2020-11-18 17:34:39 234

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(07-图像数据处理)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第7章图像数据处理部分样例代码。

2020-11-18 15:54:41 256

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(06-图像识别与卷积神经网络)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第6章图像识别与卷积神经网络部分样例代码。

2020-11-18 15:18:31 418 1

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(05-MNIST数字识别问题)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第5章MNIST数字识别问题部分样例代码。

2020-11-18 11:50:35 182

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(04-深层神经网络)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第4章深层神经网络部分样例代码。

2020-11-18 11:08:23 309

原创 【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码(03-TensorFlow入门)

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架(第2版)》第3章TensorFlow入门部分样例代码。

2020-11-18 10:48:31 265

原创 【TensorFlow】TensorFlow2.0学习笔记(一)

一、TensorFlow是什么?TensorFlow是一个端到端开源机器学习平台。它拥有一个全面而灵活的生态系统,其中包含各种工具、库和社区资源,可助力研究人员推动先进机器学习技术的发展,并使开发者能够轻松地构建和部署由机器学习提供支持的应用。开源深度学习库TensorFlow允许将深度神经网络的计算部署到任意数量的CPU或GPU的服务器、PC 或移动设备上,且只利用一个 TensorFlow API。你可能会问,还有很多其他的深度学习库,如 Torch、Theano、Caffe 和 MxNet,那

2020-09-28 20:34:35 390

原创 【推荐系统】短视频推荐系统概述

本博文主要对业界短视频推荐领域做一个系统概览,包括推荐系统与架构、召回算法与策略、排序算法的演进、分发策略的控制四大部分。

2020-09-17 20:45:11 11532 3

原创 【Python】Python安装升级mkl包

近期在使用faiss包构建knn索引的时候,经常会抛出一个Error:Intel MKL FATAL ERROR: Cannot load libmkl_avx512.so or libmkl_def.so,应该是faiss在导入mkl包出现了异常,解决这个问题的方法是在python脚本中导入mkl包,因此需要mkl包的支持。

2020-09-14 15:56:09 13710

原创 【Linux】Ubuntu系统下常用的开发环境配置

基于ubuntu系统的常用开发环境配置系统版本:ubuntu 16.04 LTS 64位

2020-09-07 14:46:33 551

原创 【Linux】Ubuntu安装IntelliJ IDEA

0. 卸载之前安装的IDEA在安装新的IDEA之前,需要将旧的IDEA卸载干净(如果有的话)。Ubuntu下卸载只需要两部就能删除干净:将原来的解压缩目录删除:在/opt路径下删除IDEA的解压缩文件夹 删除对应的配置/设置文件:可以使用下面的方法找到后再全部删除1.IDEA官网下载:https://www.jetbrains.com/idea/选择Ultimate下的一...

2020-08-02 17:51:27 1947

原创 【机器学习】word2vec学习笔记(三):word2vec源码注释

本文主要是对Google的word2vec源码进行了一些简单的注释,希望能够帮助对源码的学习与理解。

2020-08-02 17:11:35 407

原创 【机器学习】word2vec学习笔记(二):word2vec-tool

本文主要介绍Google官网提供的word2vec工具:word2vec,计算词的连续分布表示的工具。本文并不涉及word2vec算法的原理与细节,只是简单的介绍了word2vec这个工具及一些在实践中的表现等。word2vec工具提供了CBOW模型和skip-gram模型计算词的向量表示的有效实现。这些表示能够随后应用在后期的NLP应用和进一步研究中。

2020-07-31 11:38:48 733

原创 【推荐算法】Graph Embedding系列之EGES: Billion-scale Commodity Embedding for E-commerce Recommend in Alibaba

这篇paper是淘宝团队在2018年发表的一篇论文,在淘宝的推荐中,主要面临着三个技术挑战,分别是可扩展性(scalability)、稀疏性(sparsity)和冷启动问题(cold start)。论文的基本思想是在DeepWalk生成的graph embedding基础上引入补充信息,也就是将边信息引入到GraphEmbedding框架中,借此来解决上述的三个问题。

2020-07-13 11:51:20 1482 1

原创 【推荐算法】Graph Embedding系列之node2vec: Scalable Feature Learning for Networks

Node2vec是一个网络中可扩展特征学习的半监督算法,node2vec采用了一个常规的基于图的目标函数并使用随机梯度下降算法进行优化。node2vec是一种综合考虑DFS邻域和BFS邻域的graph embedding方法。简单来说,node2vec可以看作是deepwalk的一种扩展,可以看作是结合了DFS和BFS随机游走的deepwalk。Node2vec通过调整随机游走权重的方法使graph embedding的结果在网络的同质性和结构性中进行权衡。

2020-07-07 14:35:44 2170 1

原创 【推荐算法】Graph Embedding系列之LINE: Large-scale Information Network Embedding

LINE能够将非常大的信息网络embedding到低维的向量空间,同时LINE适用于带权或者不带权的有向图和无向图。LINE定义了一阶相似度和二阶相似度,并在目标函数保留了网络的局部结构和全局结构。在优化目标函数时,LINE采用了边抽样算法,提高了其有效性和效率。

2020-07-06 22:17:30 1310 1

原创 【推荐算法】Graph Embedding系列之DeepWalk: Online Learning of Social Representation

DeepWalk的输入是一张图或者网络,输出为网络中顶点的向量表示。DeepWalk通过截断随机游走学习出一个网络的社会表示(social representation),在网络标注顶点很少的情况也能得到比较好的效果,并且该方法还具有可扩展的优点,能够适应网络的变化。

2020-07-06 22:05:07 1028 1

原创 【Spark】Spark学习笔记

1. Scala基础2. Spark基础

2020-04-03 21:56:11 874

原创 【C++】C/C++代码生成C/C++可执行程序

1、首先,GCC与G++分别是GNU 的C、C++编译器, GCC与G++在执行编译工作的时候,总共需要4步:1、预处理,生成 .i 的文件[预处理器cpp] 2、将预处理后的文件转换成汇编语言,生成文件 .s [编译器egcs] 3、有汇编变为目标代码(机器代码)生成 .o 的文件[汇编器as] 4、连接目标代码,生成可执行程序 [链接器ld]这里以一个能在编译器下运行的C代码“ma...

2020-01-20 11:26:55 745

原创 【Git】Git多账号配置

目的:同一台服务器,不同用户使用各自指定的ssh key认证,互相不干扰。适用场景:公司环境下,多人同时使用GitLab仓库。具体流程如下,以用户名xxx为例: 新建自己命名的xxx_rsa公私钥,不要覆盖了机器上默认的rsa公私钥 ssh-keygen -t rsa -f xxx_rsa执行上述命令后,会生成对应的xxx_rsa和xxx_rsa.pub两个文件,将xxx_...

2019-10-23 15:44:09 402

VS2010调用Tesseract-OCR需要使用的全部工具

1.tesseract-ocr-setup-3.02.02.exe 安装文件 2.tesseract-3.02.02-win32-lib-include-dirs.zip文件 3.liblept168和VS2010编译出的3个dll文件 4.chi_sim.traineddata 简体中文训练集

2015-11-10

数据结构经典的排序算法

数据结构的7个排序算法的函数的代码,包括:1.直接插入排序 2.希尔排序 3.冒泡排序 4.快速排序 5.简单选择排序 6.堆排序 7.二路归并排序。有的代码是递归实现的,有的是循环实现的。

2016-05-24

libsvm训练集

Libsvm训练数据集heart_scale的matlab版和C++版

2015-07-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除