Bengxy

Bengxy

Little steps lead to great distances.

优雅的构造C++的静态类

使用的场景

很多时候,我们希望在程序的运行过程中,只允许一个类实体存在,那么就需要用到静态类实例。

比如,在一个银行交易系统中,我们设计一个类,用来管理当天全世界的汇率。 很显然,在程序运行过程中,这个类只需要一个,多个实例反而会导致一些数据不一致的风险。

聊一聊Query的拼写纠错

背景

在搜索引擎中,用户输入的检索词(Query)通常会出现拼写错误。如果直接对错误的Query做匹配,通常不会得到用户想要的结果。

因此,首先需要对用户的Query进行纠错,获得用户最大概率想搜的Query。

阿里百技总结

谈起梦想,总能让人激动,在进入公司前,听业内的人说阿里是一家梦想驱动的公司,年轻、充满活力。当走进百技课堂,就深深的被每一个人的活跃和热情所感染。短短三天,学到了阿里的价值观,了解了阿里的产业架构,更有技术大牛无私分享了他们的技术成果,可谓不虚此行,真是一段丰富而充实经历。

洱海骑行

6月的大理,阳光灿烂,温度适宜。洱海,紧靠着大理古城,倒映着天空的色彩,碧澄如洗。

我们的骑行从大理古城出发,逆时针环洱海,穿行于山水之间,开始了一场“风花雪月”之旅。

骑行路线

大理古城——洱海公园——金梭岛——罗荃半岛——小普陀——挖色——鹿卧山——双廊(住宿)——红山——海舌——三塔——返回大理古城

全程约130km,周围处处是景。

聊一聊Query的改写

背景

在目前的搜索环境中,最常用的是根据item文本分词,建立倒排索引。

这种方法检索速度快,逻辑实现简单灵活,同时搜索出的结果可解释性较强。但是,在这种场景下,对检索词的匹配程度要求较高,比如用户搜索“浙江大学“,那么文本中含有浙江大学的内容就会展示出来,但是像“ZJU、浙大”这样的缩写就难以捕获了。

如何理解Attention?

如何理解Attention?

Attention(注意力模型)因为其效果出众,被用于机器翻译、问答系统、图片目标检测等领域。今天来聊一聊Attetion机制。

这篇博客是我很早以前在实验室的一次分享,偏科普。

GMM高斯混合模型和EM算法

引言

网上有许多讲GMM高斯混合模型的博客和课件,但是感觉都是一上来就套理论,讲公式。对于机器学习新人来说,比较难理解:收什么启发,我们提出GMM?适用哪些场景?以及GMM的理论支撑,如为什么GMM是可行的聚类算法(收敛原因)?
因此我整理了一下自己在看GMM时候的困惑以及一些理解。

GMM: 高斯混合模型。通过假设数据服从K个混合高斯分布。或者这样讲:数据能够由K个确定的高斯分布以一定的权重叠加生成。 高斯混合模型的目的就是从数据集求出这K个高斯分布的参数 ${\theta_k}$

avatar
Bengxy
Machine Learning | ZJU | Alibaba
FRIENDS
zlthinker