静待水到渠成

数据挖掘基础知识学习笔记

搜索,尤其是个性化搜索与数据挖掘关系密切。
当搜索的质量达到一定水平,就不能再拘束于小修小补;
而应该往数据挖掘方向发展,当起自家产品的研究院,用数据做更多更大更有意思的事情!

于斯,补充一些数据挖掘方面的知识,为自己充电,也与君共享。

资料链接
http://blog.csdn.net/sherrymi/article/details/21323969
http://www.vsharing.com/k//2013-10/690272.html

基础概念
当被存储在本地时的数据称作数据,当把数据经过加工处理,它们转变成了有用的信息。如果信息经过合理的组合能够产生价值,特别是商业价值,此时就可以称其为知识。
数据挖掘的过程就是数据加工处理变成信息,最后转化为知识的过程。
大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。

主要工具
有商用的MATLAB、IBM Intelligent Miner、SAS ...

个性化搜索引擎学习笔记

搜索做了半年,亟需解决的问题基本没有了,前两代搜索引擎所能做的事情完成得尚可。
之前的搜索引擎学习笔记里对第三代搜索引擎介绍较少,故另外详细学习下个性化搜索引擎。
为后续的工作提供基本的技术知识。

资料链接 http://blog.csdn.net/xiaoyu714543065/article/details/7932154

个性化搜索引擎的目标

准确描述用户兴趣:为不同用户提供不同的服务, 以满足不同的需求。提高站点的服务质量和访问效率,从而吸引更多的访问者。
用户感应式:user sensitive PageRank, 搜索引擎感兴趣的不单单是某个单一用户的个性化搜索,而是某些用户的分类化(式)的个性化(较小范围内显性/隐性用户反馈的集合)。
直觉搜索:(intuitive search):能够在用户没有考虑清楚要寻找什么之前,为用户呈现所需的信息。

个性化搜索引擎的分类

目前,个性化服务根据其所采用的推荐技术可以分为两种:基于规则的系统和基于信息过滤的系统,其中信息过滤系统又可分为基于内容过滤的系统和基于协作过滤的系统。

基于规则的系统:利用预定义的规则来过滤信息,它的优点是简单直接,缺点是规则质量很难保证,而且不能动态更新,此外,随着规则的数量增多,系统将变得越来越难以管理。
基于内容过滤的系统 ...

辩论七律——转自奥卡姆剃刀的博客

无论是从事产品工作还是其他,逻辑性都是可贵的。
逻辑性同时也是可以训练的,思考问题时遵守逻辑规律,尽量周全考虑,如此长久逻辑性便会增强。
虽然逻辑性不强不利于从事产品工作,但是你可以选择让自己变强!
本文分享给跟我一样觉得自己逻辑性不够强的产品新人。

原文链接:http://blog.sina.com.cn/s/blog_6c7e111d0101alcq.html
此文已发表于《北京科技报》。

互联网拉近了人们的距离,但并没有同化人们的思想,网络辩论硝烟弥漫,热点话题层出不穷。但嘈杂背后的真相,却是情绪释放的帖子远多于冷静讲理的帖子,即使试图讲理的帖子,也有很多是逻辑混乱的,以致于各说各话,难获共识。特别是在微博,四处起火,一地鸡毛,而乱相丛生最主要的原因是网友的逻辑能力欠缺。根据多年的辩论经验我总结了七条辩论逻辑,供您参考。

1、有“证伪性”才有意义

你是一个战士,连长的战前动员称“只要冲锋跑得快,就不会受伤”,你拼尽全力冲了出去,被人血肉模糊地抬了回来,你质疑连长,连长的回答是“那是因为你冲得不够快,否则就不会受伤 ...

历史的真言——托克维尔文集摘抄

不想多言,毋须多言。
折服于托克维尔的思想,感慨于历史的如此相似。
只愿,我们的时代能够避免历史悲剧的重演。

纵使我如此渺小,但是我希望自己,至少能不太过糊涂地苟活,至少能于内心留一方净土。

《旧制度与大革命》前言节选

在这种社会中,人们相互之间再没有种姓、阶级、行会、家庭的任何联系,他们一心关注的只是自己的个人利益,他们只考虑自己,蜷缩于狭隘的个人主义之中,公益品德完全被窒息。专制制度非但不与这种倾向作斗争,反而使之畅行无阻;因为专制制度夺走了公民身上一切共同的感情,一切相互的需求,一切和睦相处的必要,一切共同行动的机会;专制制度用一堵墙把人们禁闭在私人生活中。人们原先就倾向于自顾自:专制制度现在使他们彼此孤立;人们原先就彼此凛若秋霜:专制制度现在将他们冻结成冰。

在这类社会中,没有什么东西是固定不变的,每个人都苦心焦虑,生怕地位下降,并拼命向上爬;金钱已成为区分贵贱尊卑的主要标志,还具有一种独特的流动性,它不断地易手,改变着个人的处境,使家庭地位升高或降低,因此几乎无人不拼命地攒钱或赚钱。不惜一切代价发财致富的欲望、对商业的嗜好、对物质利益和享受的追求,便成为最普遍的感情。这种感情轻而易举地散布在所有阶级之中,甚至深入到一向与此无缘的阶级中,如果不加以阻止 ...

灰度发布相关学习笔记

知乎:
http://www.zhihu.com/question/20584476
http://www.zhihu.com/question/21714205
腾讯大讲堂:
http://djt.qq.com/article/view/16

灰度发布与灰度发布系统

灰度发布是指在黑与白之间,能够平滑过渡的一种发布方式。灰度发布可以保证整体系统的稳定,在初始灰度的时候就可以发现、调整问题,以保证其影响度。

AB test就是一种灰度发布方式,让一部分用户继续用A,另一部分用户开始用B,如果用户对B没有什么反对意见,那么逐步扩大范围,把所有用户都迁移到B上面来。
内测发布也是一种灰度发布方式,只有内部员工可以体验到新版本,如此可以提前发现新版本的问题,及时调整,减少上线的风险。
AB test由于是从用户中分出一半来体验新版本,涉及的用户面较广,因而除非某个功能牵动大量的用户信息和数据信息,或者做迁移的成本很高,或者实在无法准确判断用户对两功能的态度,否则尽量不要采用AB test。AB ...

野雁——Mary Oliver

Wild Geese——by Mary Oliver

You do not have to be good.
You do not have to walk on your knees
For a hundred miles through the desert,repenting.
You only have to let the soft animal of your body
Love what it loves.
Tell me about your despair,yours ...

Native APP与Web APP的学习笔记

小小总结下百度和知乎上看到的关于各类APP实现方式的知识。
扫下盲,以免跟技术GG沟通时太白痴哈~

Native APP、Web APP、Hybrid App

App,指运行在智能的移动终端设备第三方应用程序。

在高端智能手机系统中主要有以下几类应用程序:

Native App是一个原生程序,运行在本地操作系统如IOS、Android、WP上并使用原生程式编写运行,又叫本地APP。在实现上是使用Objecttive-c和cocoaTouch Framework撰写的IOS程序,或者选择java+Android Framework撰写android应用程序等。

Web App是基于高端机的浏览器运行的应用,宿主是浏览器不再是操作系统,其实也就是一个针对手机操作系统优化后的web站点,是一个触屏版的网站。它使用的技术一般是HTML或HTML5、CSS3、JavaScript,服务端技术JAVA、PHP、ASP。不过,现在由于高端智能手机(Iphone、Android)的内置浏览器都是基于webkit内核的,所以在开发WEBAPP时,多数都是使用HTML5和CSS3技术做UI布局。

Hybrid App是介于上面二者之间的一种半原生程序,伪造了一个浏览器的apk/ipa原生程序,把地址写死了,然后里面运行了一个webapp ...

六十韶光等一吻——关于玫瑰

缘分只负责相遇,至于相知相爱相守,从来都必须自己负责。

你这木头,等到看到别人送女友玫瑰了才跑来问我说喜不喜欢玫瑰。
“恩,还好啦,没必要,又贵又没法存。”
于是之后你更坚定了不能送玫瑰的念头。

一次经过一个花市,我说,老公给我买枝玫瑰吧。
你不是不喜欢吗?还是给你买吃的比较实在嘻嘻……(一脸坏笑)
好吧,那你以后求婚的时候再给我送玫瑰吧。
求婚的时候?不行!太早了!你想要我送的玫瑰?那等咱六十周年的时候吧。
好吧,不带这么一坑就坑人六十年的……
不过谁怕谁啊,有本事一起活到结婚六十周年!

给政府官员讲解云计算的窍门——转自网络

做产品尤其是搜索这种重视策略的产品,还是需要懂技术滴~
分享一篇用通俗易懂的语言介绍云计算的神文!

作者:杨海峰
微信链接:http://mp.weixin.qq.com/s?__biz=MjM5MjEzMDk4Mg==&mid=200013405&idx=1&sn=5c07564af93ad5430df6fe152b3a9719&scene=2&from=timeline&isappinstalled=0#rd

技术人员怎么也讲不清楚的云计算,咱们的高级总监曾经就是这样和政府领导普及云计算的知识,却都听懂了:

你娶了一个老婆,这叫传统IT架构。你觉得一个老婆不够,这叫传统企业CIO的困境。你又娶了一个老婆,这叫双活数据中心。你在外地又娶了一个小老婆,这叫两地三中心容灾。你娶了很多风格气质各异的小老婆,以至于形成了后宫,这叫私有云。你的后宫就叫计算资源池。你从后宫里选出懂事有能的管理其他小老婆,这叫私有云管理方案。管事的那个就是HYPERV或VMWARE。你不娶小老婆,改成包养很多情人,这叫托管云。

你是穷人,没有钱包养任何人也没钱娶小老婆 ...

这样的一生我已经过完了——观《一一》

电影给了我们经历自己没有机会经历的人生的机会,也给了我们提前明白自己的人生真相的机会。
一一,是后者,我希望同时它还是前者。

三个小时,讲述的其实不过是绝大多数人的人生。
它就跟绝大多数人的人生一样,平淡,没有高潮起伏。

只因为好奇名字而下载,然后在完全无知的情况下,我用三个小时看完了一生。
仿佛,也过完了一生。
这一生,很平淡,我过得疲惫而孤独,有即使重来也无法修复的往事,有无法撇清的亲人朋友的杂事,有神灵无力但其实可自救的重复!
结束这一生,我是不甘而失落的。
但是,再怎么绝望,若是我还是这样的南俊还生活在这样的年代,那么即使再给我一次机会,我仍然会如此度过一生。
而再次度过,其实没那个必要。

是的,如果再次度过,真的没那个必要。
幸而我是在未满23岁的时候过完了这样的一生。
这只是电影里的一生,虽然是绝大多数人的人生,不过我自己的人生希望不会再次这样度过!

现在,已经不再是那个出生死亡陪一个人吃饭睡觉过日子,不能有自己的梦想,跟伴侣没有心灵交流的时代了!
请原谅我尚存的希望,不用提醒我生活的不可控。
我幸运地拥有宽容开明的家庭,我自知地一步步去做喜欢的事情,我真诚地和灵魂伴侣一起呵护我们的感情……我的生活依旧平淡,但是很充实;我的肉体不时疲惫,但心灵愉悦 ...