Joye Cai's Blog

Know more, Do more, Be more

Tensorflow进阶

For Deep Learning

Last updated on 2018-10-1… CNN CNN代码转载自bryan的博客,任务是MNIST手写数据集的分类。 数据集 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #导入数据 mnist = input_data.read_data_s...

Tensorflow基础

For practice

Last updated on 2019-6-19… 计算图的概念 计算图是一个强大的工具,绝大部分神经网络都可以用计算图描述。 计算图用节点表示变量(标量、向量、矩阵、张量都可以),用有向边表示计算。 自动求导应用链式法则求某节点对其他节点的雅可比矩阵,它从结果节点开始,沿着计算路径向前追溯,逐节点计算雅可比。 将神经网络和损失函数连接成一个计算图,则它的输入、输出和参数...

2018腾讯广告算法大赛经历

Focus on CTR

Last updated on 2019-10-22… 不久前参加了2018腾讯广告算法大赛,就顺手简单整理了一下学术界推荐系统的发展,以及作为推荐系统主要分支——CTR在工业界的发展。 学术界 学术界经历了“内容过滤->协同过滤->矩阵分解->深度神经网络模型”这样的一个发展历程: 内容过滤 使用关于item(例如产品类别,item内容,评论,价格)和用...

QQ音乐推荐技术

By HAB

Last updated on 2018-4-19… 本篇为来自腾讯的黄安埠(THU硕士)在2017北京机器学习峰会上的分享。 引言&目录 CF Model NLP Model 用户画像 推荐架构 难点&挑战

Python画图篇

For Data Mining

Last updated on 2019-7-23… python语句 pandas常用函数、pandas文档 pygal通用画图 networkx社会网络图 pyecharts地理地图、pyecharts示例、国家名称 概率密度图 可见特征f1是要保留的,特征f20是要舍弃的 import matplotlib.pyplot as pl...

Python增加样本篇

For Data Mining

Last updated on 2018-9-25… python语句 pandas常用函数、pandas文档 pygal通用画图 networkx社会网络图 pyecharts地理地图、pyecharts示例、国家名称 本篇是特征工程和模型之外的技巧篇,方法是增加新样本,即利用半监督代替过采样,以解决样本不平衡问题。(»原文链接) 迭代半监督 利...

Python模型训练篇

For Data Mining

Last updated on 2019-7-23… python语句 pandas常用函数、pandas文档 pygal通用画图 networkx社会网络图 pyecharts地理地图、pyecharts示例 model.py import numpy as np import pandas as pd import lightgbm as lgb f...

Python特征选择篇

For Data Mining

Last updated on 2020-3-12… python语句 pandas常用函数、pandas文档 pygal通用画图 networkx社会网络图 pyecharts地理地图、pyecharts示例、国家名称 本篇是上一篇《python特征工程篇》的一个子集,由于内容较多而单独出一篇。(»原文链接) 特征选择 特征选择是特征工程里的一个重要...

Python特征工程篇

For Data Mining

Last updated on 2020-11-1… python语句 pandas常用函数、pandas文档 pygal通用画图 networkx社会网络图 pyecharts地理地图、pyecharts示例 特征工程是对原始数据进行一系列处理,将其提炼为模型可理解的输入数据格式,为模型提供信息增益以提升模型精度,特征工程是一个表示和展现信息的过程。 在...

XGBoost推导

决策树的boosting模型

仅主要知识点梳理 引言 XGBoost的全称 eXtreme Gradient Boosting,2014年2月诞生的专注于梯度提升算法的机器学习函数库,作者为华盛顿大学研究机器学习的大牛——陈天奇。他在研究中深深的体会到现有库的计算速度和精度问题,为此而着手搭建完成 xgboost 项目。xgboost问世后,因其优良的学习效果以及高效的训练速度而获得广泛的关注,并在各种算法大...