maple Blog

Coder

2023

2023年已然过去,总要写点什么,免得回头看忘了这一年干了啥;今年觉得自己异常的忙碌,除了在工作上花费了大量的时间,生活也逐渐成为了有19个月带娃经验的老父亲了。这一年看着娃慢慢学习爬行、站立、走路,每学会一个技能,都觉得小家伙好厉害,虽然学会的时间总是在体检之后才达成,有那么一点慢,内心也不焦虑,总会学会的;虽然团宝现在还不会讲话,可已有自己的意识,会有自己想吃的东西,想玩的玩具,更是学会...

2022

魔幻的2022年终于过去了,虽然一整年依然在防疫中度过,生活中还是迎来了很多变化。一整年的核酸还是没能抵挡新冠的到来,大多数人还是在2022年的最后一个月,经历一场发热,用这样的方式迎接新年,也是令人无奈。 2022年还是发生了很多大事的,例如俄乌冲突,再然后是疫情爆发,魔都停摆;每一件都足以写入历史了。不过这些都太宏观了,对我个人来说,最重要的莫过于迎接团宝宝的到来;在有娃之前,本来工作...

2021

2021 又到岁末了,对于新年的到来还有点激动呢;这几天我再回想年度关键词的时候,突然想到敬畏 这个词。 敬畏工作; 敬畏市场; 敬畏生命; 今年接种了2针疫苗,肆虐了2年多的疫情还没消停,希望来年可以自由出行。 工作 今年换了个超级忙的工作,自2013年参加工作以来,强度最大的工作了;每天近乎于以往3倍的工作量,我都不知道自己是怎么想的;可能从来没考虑过工作强度的原因,反而是遇...

2020

2020 又是一年的尾巴,充满意外的2020年,就要结束了。年初的疫情,出乎所有人的意料,自己的欧洲出行计划也被取消了,免不了被家人一顿抱怨。1月27号的航班,26号接到通知,旅行团被取消了,很失望。 本来是打算回老家过完年,再出游,结果没能回老家,也没能出游,这个春节是最郁闷的了,外地人无非就是这点念想,过年的时候回个老家,见见那些见面频次以年为单位的亲戚朋友。 工作 年初开始了在家...

2019

2019 2019岁末,今年又一次换了工作。离开待了几年的互金行业,误打误撞进入电商。本来打算可以在风控领域深入做下去,不过很可惜,在入职之后,这边风控需求并不大,后来的风控的新同学,来了2个月便走了。而自己虽然留下来了,却干起了物流预测的活。复杂的业务逻辑,再加上之前并没有物流经验,相当阵痛的一段经历。好在坚持下来,收获良多,希望新的一年可以学到更多吧。至于工作带给我的焦虑,似乎减轻了些...

Deep Interest Network for Click-Through Rate Prediction

Deep Interest Network for Click-Through Rate Prediction 一篇来自阿里妈妈团队的paper,关于提升广告系统的CTR。 近年来,Deep learning在NLP和CV领域的很多应用都取得了State-of-the-art的效果。同样地在CTR预估方面,也有所尝试,比如wide&deep、Embedding&MLP。 ...

Deep Neural Networks for YouTube Recommendations

Deep Neural Networks for YouTube Recommendations YouTube 视频推荐论文。 SYSTEM OVERVIEW candidate generation network ranking network 推荐系统主要分为2大部分,候选集生成网络,ranking网络; candidate generation的输入主要是...

Wide & Deep Learning for Recommender Systems

Wide & Deep Learning for Recommender Systems 文章来自于Google,提出结合了Wide模型和Deep模型的方法,来提升推荐效果;该网络模型应用于Google play的app推荐。 首先,文章开头提到Generalization和Memorization Generalization 对于大规模的回归或者分类问题:线性模型...

2018

2018 2018年终于换工作了,从2016年开始就一直为工作的事情焦虑。而今年终于有勇气作出改变,也许本来就没有完美的工作,唯一能保证的就是自己不断地学习。 2018年5月21日,入职新公司。换工作中间都没怎么休息,只有一个周末,现在回想估计我也是停不下来的,休息着可能会更焦虑。后来的几个月,换工作并没有让我觉得心态转变。而是持续数月的低质量睡觉。那是绝对令人绝望的日子。虽然自己尝试着...

Tensorflow RNN Attention Seq2Seq

Seq2Seq Seq2Seq是自然语言处理里非常经典的模型,以及后来引入Attention机制,在各种NLP任务中都有很好的效果。 结合Tensorflow里的源码,来一起了解下其背后的实现逻辑。 basic_rnn_seq2seq def basic_rnn_seq2seq(encoder_inputs, decoder_inputs,...

Tensorflow BasicRNNCell

RNN 关于RNN的文章,colah的blog这篇文章讲得很详细。从基本的RNN到LSTM以及各种变种。 不过关于RNN里num_units的含义,weight参数的数量计算,没具体提到。 首先来看下Tensorflow里RNN的实现。 @tf_export("nn.rnn_cell.BasicRNNCell") class BasicRNNCell(LayerRNNCell)...

2017

新年快乐,今天已经是2018年了。总结又晚了几天,每每到这时候,总要感叹下时间过得很快,大概是因为总觉得过去一年好似虚度了。内心多少有些焦虑。再看看年初列的todo。其实还有不少没完成,一直考虑要换工作的,这件事也一直没办成,不知道是自己水平有问题,还是觉得很难找到自己合适的,大概是期望过高吧,或者兼而有之,导致自己又很焦虑。 工作上,没按照预期跳槽;这一年倒是接触了图像领域,还是有不少收...

Python tornado multiprocess multithreading

tornado Tornado是Python生态中性能比较不错的Web服务框架。 Tornado 和现在的主流 Web 服务器框架(包括大多数 Python 的框架)有着明显的区别:它是非阻塞式服务器,而且速度相当快。得利于其 非阻塞的方式和对 epoll 的运用,Tornado 每秒可以处理数以千计的连接,这意味着对于实时 Web 服务来说,Tornado 是一个理想的 Web 框架。...

2016

时间过很快,2016转眼已逝。 这一年还是有不少的变化,生活逐渐有自己的节奏,为自己而活。也做了不少错事,希望可以得到原谅,多是自己没有处理妥当。 6月份和@傅先生去了新加坡,其实他早已准备好去的。而我后来才决定同行,因为突然发现年假还有好多没用完,也因为那段时间,自己的状态比较差吧,希望可以去散散心。 行程从半夜晚点的航班开始,再加上拥挤的座位,一晚上都没睡着。第一次使用airbnb预...

Deep Learning-word2vec

词向量 在自然语言处理中,需要将具体的文字数字化,那么就可以当做常规的机器学习问题。 比如短文本分类,首先是一个句子的形式,需要转化为单个词语。然后还需要转化为具体数字,用来描述、分析词之间的关系等等。 One-hot Representation 比如 苹果 [0 0 0 1 0 0 0 0 ...] 香蕉 [0 0 0 0 0 0 1 0 ...] 那么每个词就是一堆0的...

caffe安装-Mac

caffe安装 Mac 10.11.2 更新brew brew update brew upgrade 安装依赖 brew install -vd snappy leveldb gflags glog szip lmdb # need the homebrew science source for OpenCV and hdf5 brew tap homebrew/scienc...

AC自动机

AC自动机 Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一。比如,给出一组单词,再给出一组字符串,找出有多少个单词在这个字符串中出现了。当然最简单的方法是逐个去找~:P 预备知识 KMP Trie AC自动机需要以KMP、Trie字典树为基础来实现。不了解的话可以先看下这个2个。 KMP算法是单模式的字符匹配算法...

中文分词-HMM模型

中文分词-HMM模型 关于HMM模型的文章和资料有很多,各种公式推导看起来也是有点复杂。不过还是那句话,多看看~~~ 模型介绍 隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。 摘自百科,有点抽象的。一般书上的介绍主要有...

中文分词-正向最大匹配

中文分词-正向最大匹配 中文分词,一个很常见的问题。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界。 常用分词方式 字符串匹配 这类分词方式有正向/反向最大匹配,等等。 实现方式简单,速度也较快; 不过缺点是比较依赖字典,对于字典里没有的词(也就是未登录词)...

KMP算法(Knuth-Morris-Pratt)

KMP算法(Knuth-Morris-Pratt) KMP是一种优秀的字符串匹配算法,之前看了好多文章都没弄明白,现在说下自己的理解。 首先我们最普通的字符串匹配,比如在某个字符串中寻找子串,那么一个一个移动,逐个比较。 显然效率会比较低下。 下面说下KMP的做法。 部分匹配表(The Partial Match Table) KMP算法最关键的就是这个表了。刚开始确实很难搞明白,下...

Go Json 解析

关于Go中对json的解析有点独特的地方。 Go自带解析包,C++只能自己写,或者网上找库了 :P import “encoding/json” 首先看下最基本的用法, type Person struct { Name string Age string } func testPerson() { str1 := "{\"Name\":\"hello\",\"Age...

2015年之前的博客

之前使用csdn的博客,后来有一段时间,因为老被盗号,经常导致我登录不了。于是乎,就想着自己建站了。 之前的文章主要是关于 Hadoop,机器学习,C++. Hadoop 机器学习-Kaggle竞赛-Titanic 机器学习-Kaggle竞赛-Digit recognizer 机器学习实战-PCA主成分分析、降维 机器学习实战-朴素贝叶斯算法 机器学习实战-决策树 机器学习实...

2015

生活太单调。我也想不起来,发生了哪些。 2015-01-01,新年第一天,和黄靖去了南京。嗯,住的酒店对面的馄饨店有一种馄饨叫黯然销魂,令我印象深刻,据说很辣,也没尝试。很难得有人可以一起出去玩耍。自己一个人出游呢,好像也挺无聊的,so玩的次数并不多。后来的10月份,因为没买到火车票,小黄又不考虑飞机,西安也没去成,本打算11月份再计划一下,又因各种因素终未成行。 关于工作呢,成长也不少...