Joye Cai's Blog

Know more, Do more, Be more

常用评价指标

分类、回归、排序

Last updated on 2018-9-29… 原文来自《美团机器学习实践》,Target:使线下指标的变化趋势跟线上指标一致。个人做了一些补充和注解。 这篇有更透彻的理解 分类指标 以二分类为参考的话: Precision 精确率 表示当模型判断一个点属于该类的情况下,判断结果的可信程度。 Recall 召回率 表示模型能够检测到该类的比率。 对于...

感知哈希算法

For 计算图像相似性

Last updated on 2018-9-21… 感知哈希算法(Perceptual hash algorithm),它的作用是对每张图片生成一个”指纹”(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。 方法简述 下面是一个最简单的实现: 第一步,缩小尺寸 将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节...

Python大文件处理

For Data Mining

Last updated on 2019-3-21… 基础知识 进程与线程 进程在执行过程中拥有独立的内存单元,而多个线程共享内存。 进程切换时,耗费资源较大,效率要差一些。对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。 一个程序至少有一个进程,一个进程可以有多个线程。 Python多线程 Python中的多线程是假的多线...

Attention机制

Self-Attention、Multi-Head Attention、Transformer、Position Embedding

Last updated on 2019-11-8… 《细讲Attention Is All You Need》、《Attention is All You Need》浅读(简介+代码)、Self-Attention与Transformer、【NLP】Transformer详解 前言 Attention机制最早是在视觉图像领域提出来的(上世纪90年代),但是真正热门起来...

代价函数

Cost Function

Last updated on 2019-4-11… Cost Function和Loss Function的区别: Cost Function:指基于参数w和b,在所有训练样本上的总成本 Loss Function:指单个训练样本的损失函数 各种概率分布 均方误差 MSE 假设是高斯分布,又名正态分布 均方误差的含义是求一个batch中n个...

机器学习知识整理

For 面试

Last updated on 2019-11-8… 相关资源整理 基础:线性代数、概率统计、优化 part1、优化 part2、信息论及其他 学习:ML整理1、ML整理2、ML算法、ML面试 笔记:斯坦福ML笔记、吴恩达ML、吴恩达DL 代码:李航ML、DL 判别式与生成式 分类与回归 参考链接、12种回归算法 回归与分类的根本区别在于输出空间是否...

C++动态规划题型

For 笔试

Last updated on 2019-10-11… 动态规划求解的一般思路: 判断问题的子结构,当具有最优子结构时,动态规划可能适用。 求解重叠子问题。一个递归算法不断地调用同一问题,递归可以转化为查表从而利用子问题的解。(分治法则不同,每次递归都产生新的问题。) 重新构造一个最优解。 01背包问题 有 n 个重量个价值分别为 w<sub>i&l...

C++字符串题型

For 笔试

Last updated on 2019-10-4… 字符串常用技巧: 查找表:标记字符最新的位置 int table[256]={0}; table[s[i]] = i; 标记各单词中字符出现位置 vector<vector> pos(128) 滑动窗口 if(i>=l1) c2[s2[i-l1]-‘a’]–; memcmp(c1,c2,sizeo...

C++排序算法

For 笔试

Last updated on 2019-10-4… 总览 关于稳定性(简单说就是两个相等的元素,排序前后相对位置不变) 稳定的排序算法:冒泡排序、插入排序、归并排序和基数排序; 不是稳定的排序算法:选择排序、快速排序、希尔排序、堆排序。 参考链接 冒泡排序 冒泡排序是最简单粗暴的排序方法之一。它的原理很简单,每次从左到右两两比较,把大的交换到后面...

C++二叉树

For 笔试

Last updated on 2019-10-4… 直观理解二叉树遍历 定义与创建 #include <iostream> #include <string> #include <queue> #include <stack> using namespace std; string str; int i; struc...