从去年11月25日入职,除去寒假一个月,算来也已经满4个月了。
却丝毫没有觉得枯燥厌烦,依旧每天都感觉到压力和成长!
工作的重心从搜索优化转移到数据挖掘和一点点客户端设计的需求。
当然,搜索的优化是没有止境的,本不能忘,只是暂时不会有太大的优化。
一直认为,走走应该停停,思考和总结才能真正成长。
于是,这个周末趁闲思考了下自己这4个月的搜索工作,试图做个小结。
其中,大多数是自己的工作积累,当然不可避免会有导师的指导和看过的相关学习资料的影响。
在信息爆炸的时代,搜索是我们查询自己所需信息的得力助手。
无论是大搜索产品,还是其他产品中的小小搜索框,搜索称得上是一款产品的标配。
那,搜索究竟是做什么的呢?搜索PM的工作又是做什么的呢?
搜索的目标
搜索的目标,是帮助用户更快找到想要的结果项。
当然这是单纯的说法,对于终极目标为盈利的产品来说,搜索归根还是为KPI服务的。简单举例,搜索用户的目标一般是增加用户点击关注的比例;搜索商品的目标则是增加用户形成购买行为的比例。
但是,是不是100%给用户他想要的,用户就满意呢?
不是的。
鬼脚七曾经在《搜索的悖论》一文中提到,当用户没有明确目标时,假如搜索做到最准确,让搜索结果里所有的项都是用户想要的,用户反而不满意了,因为都是可选择的等于不知如何选择。这时候即使第一条结果是他最需要也是最终选择的,他还是会看看后面的选项后再回头选择第一条。
搜索产品架构
如上图,是搜索产品架构,一般搜索相关的feature都可以归到这样的一个架构里。
一,数据。
数据,是搜索的原料,技术术语是“索引”。只有用索引里的内容作为搜索词才能搜索到你想要的结果。比如,用户搜索索引里有用户的昵称,则你可以用昵称搜索到你的好友;没有用户的简介,则你不能用简介里的内容搜索到你的好友。如果是产品内搜索,数据相对好控制些;如果是从外抓取数据的网页搜索等,则可以从爬虫的来源的数量和质量入手,由于没做过所以在此不细谈。
数据,讲究“全、准、快”,依次对应的是:不能丢失数据,数据不能有误,数据是否实时同步还是容许有多长时间的延时。
二,query,即搜索词。
query,是用户输入搜索框的内容。
相关的策略有用户未输入时是否提供搜索词推荐,输入过程中是否根据已经输入的前缀进行智能提示,输入完成发送请求后是否搜索词进行超长截断和智能转换等。其中每一个步骤都可以细化成很多的策略,比如智能转换中还细分大小写转换、拼音转换、简繁体转换、中英文转换、数字文字转换等等,每一个转换都需要适当的策略。
三,排序。
排序,在此包括什么内容可以被纳入搜索结果,以及众多的搜索结果之间的先后排序两个方面。
按照搜索内容的不同,排序可以划分为用户搜索,作品搜索,主题搜索等等。
在上图中,列出的是排序的因子,第一重要的是相关性。只有相关的结果才可纳入搜索结果中。不过有些产品会把相关性的大小作为重要的排序因子,而有些产品则设定相关性的阈值,只是将相关性作为过滤条件。
在经过相关性处理的结果里,还会再按照其他的二级因子进行内部排序。这里的因子就因产品而异因搜索内容而异了,比如淘宝商品的销量、人气、信誉等等。可以通过观察和梳理搜索内容的特征值提供思路。
还是借用鬼脚七的文字,以淘宝的综合排序为例,总体的排序逻辑是,先按照宝贝和搜索关键词相关性过滤,然后按宝贝下架时间做预选,接着在预选结果里面计算按照卖家的服务质量分、宝贝的人气分,之后对消保、橱窗推荐位等宝贝进行部分加分,最后形成统一的分数进行排序。
四,页面优化。
搜索虽然侧重于数据和策略,但还是需要呈现给用户的。页面优化指的就是搜索在客户端、PC端等等的展示。
页面优化工作细化为UI优化、交互优化、功能性设计。功能性设计是指新增搜索功能的展示,比如增加一个综合搜索的类型等,是比较大的优化。UI和交互优化是比较细节的小修小补。(此部分我接触很少,如若理解有误欢迎指出)
五,反作弊。
随着用户增多,内容增多,作弊行为会越来越多。如果某种作弊行为影响了用户体验或者正常内容的结果排序,搜索就需要通过反作弊来维护正义啦!
反作弊如果针对行为打击,则只能见招拆招,总是滞后于作弊。因此,如果有必要的话,还需要针对作弊者进行打击,限制作弊者或者直接一棒子打死,这其中对于作弊者的识别如果复杂的话会涉及到数据挖掘的工作,至于打击的具体方式和程度又是PM需要根据问题和需求制定适当的策略的问题啦。
六,统计与审核。
统计用户的搜索行为数据,便于分析用户行为特征,更深入了解用户需求,即时发现用户需求的变化,针对性地优化或完善搜索。
制定定期的搜索质量评测体系,人工标注+机器指标结合,对搜索质量量化,便于每日监控搜索质量。
我还把一些提高工作效率的小工具也纳入统计与审核里面,比如a/b test的评测平台,Bad case平台等等。切记,并不是什么情况下埋头苦干都值得鼓励的!要学会聪明且合理的偷懒方式。
搜索PM的工作内容
从搜索产品架构,可以看出,搜索PM是比较偏策略偏数据的,界面与交互相对要少一些。因此,搜索PM基本都要求有技术背景。
但是这并不是说搜索PM就可以“两耳不闻窗外事,一心埋头做搜索”了,因为搜索的基础——数据,会受整个产品的影响。因此,搜索PM还是要有全局观,要了解整个产品的动态,及时预料用户行为和需求的变化,做出相应的调整;或者利用新的可获取的数据,来丰富搜索的索引或排序因子等等。
不过,搜索PM还是得益于其特殊性的,由于大部分需求都是策略和数据相关的,不涉及软件客户端不需要跟版本,所以搜索PM的工作比较有规律较少为了赶版本而突击加班什么的哈~
下面介绍下搜索PM的日常工作内容。
发现问题:每日数据的监控,用户反馈的整理汇总,及时发现bad case或新的用户需求;
分析问题:对bad case分析其原因和性质。性质包括是否必现,是一类问题还是一个意外,是急需解决还是可以搁置继续观察等。每个Bad case都记录便于跟进。对于新需求,同样需要评估其益处有多大等。
划分优先级:根据问题性质划分优先级。影响大的问题需要优先解决,即使时间有限也需要先做应急处理。如果问题不严重或者涉及的用户不多,可以暂不处理。
制定策略:针对bad case或新需求制定可能的解决策略,与开放一起评估可行性、效果及开发成本等。挑选出较优的某个策略进行实现,根据demo评测结果或a/b test效果等进行调整优化,迭代直到较好的解决问题。
上线:不涉及软件客户端的优化,只需后台上线即可。搜索的优化是无止境的,所以不要追求完美,而应追求优于线上,一点点进步。
定期评测:定期做搜索质量的系统性评测,以弥补小修小补的优化的局限性,并为下一阶段的优化提供指导及重点。
虽然评测等都是很体力的活,但却也不是简单的事情。制定一个能真实反映用户感受的指标完善、可量化、可操作的评测方案是很有难度的。
搜索不仅锻炼人的性格,还锻炼人的思维方式。
后记
首先,感谢沉稳內慧的yee姐把我带上搜索之路,我相信一个好的直接导师对成长的重要性远胜过一个好的公司!
3个月的指导真的教给我太多!谢谢!
另外,上述总结只是我4个月的搜索PM实习的经验总结,还比较稚嫩;并且我只接触过产品内搜索未做过大搜索,所以可能会有所偏差。
期待指正与交流,一同进步!