最近都是学习笔记的节奏哈~~归根到底是我太弱了,有好多要学习的东西~~
今天转发的是搜索引擎结果质量的量化方法的介绍。
对原文进行了更符合PM需求的改动,去掉了一些技术实现的细节。
搜索引擎的结果质量如果是人工来判断,主观性较强,需要有一个量化的并且尽量自动化的指标。
本文主要介绍的就是搜索引擎结果质量的常见评价指标和量化方法。与君共学。
陈运文: http://www.infoq.com/cn/articles/cyw-evaluate-seachengine-result-quality
前言
搜索质量评估是搜索技术研究的基础性工作,也是核心工作之一。评价(Metrics)在搜索技术研发中扮演着重要角色,以至于任何一种新方法与他们的评价方式是融为一体的。
搜索引擎结果的好坏与否,体现在业界所称的在相关性(Relevance)上。相关性的定义包括狭义和广义两方面,狭义的解释是:检索结果和用户查询的相关程度。而从广义的层面,相关性可以理解为用户查询的综合满意度。直观的来看,从用户进入搜索框的那一刻起,到需求获得满足为止,这之间经历的过程越顺畅,越便捷,搜索相关性就越好。 本文总结业界常用的相关性评价指标和量化评价方法。
Cranfield评价体系
二十世纪五十年代英国Cranfield University提出了一套由查询样例集、正确答案集、评测指标构成的完整评测方案,并从此确立了 ...