星期日, 十一月 04, 2007

以推送的方式改造"Baidu知道"

我过去提出过很多想法,部分也发表在这里,但最后基本都是没有下文的。以至于当我告诉丫头我有一个想法时,还没讲故事,她就笑的不行了。想法嘛,就是随时都要提,提出来才能进一步思考嘛。

“Baidu知道”我从来没有用过,但基本过程我还是了解的,有人提问,有人解答,这种问答的方式是社区的基本交互方式。因此我的出发点就是如何以更好的方式让提问者得到答案,这种更好应该是更快、更准确、用户付出代价更小。

Google通过人工智能的方式,以强大的计算能力为基础,为用户提供了一个统一的问答系统。比如我们可以搜索框中输入“华南虎灭绝了吗”。搜索引擎自身并不告诉我们结果,而是将我们转交给其他问答社区,比如“Baidu知道”,“Yahoo知识堂”,从而进一步获得结果。这里表面上看是没有人的参与,但其实最终解答问题还是需要人类的智慧贡献。
“Baidu知道”,采取另一条路,即自己建设知识社区,维护知识树和用户群。人们在社区内发布问题,志愿者去解答相关的问题。我之所以提出以推送的方式改进“baidu知道”,是觉得简单发布,等待解答的方式效率不够高,问题并不能第一时间被能够解答的人感知到,即使这个人是Baidu的用户,人们需要首先登录“Baidu知道”社区,找到自己熟悉的领域,然后在很庞大的问题池中选择问题来回答,针对性不强,时效性不高,造成的结果就是解答的质量参差不齐(结论很武断,只是推断出来,没有进行实证研究,在此提示读者请忽略此结论)。在提问时,提问者会为问题分类,这个分类体系是Baidu设计的,但层次大概有三四层。由于分类的粒度较大,因此问题池也较大,这不利于人们解答。

推送是一种大家很熟悉的方式,比如Email、RSS订阅、IM消息等。目前人们谈推送主要是指在用户提出显性请求之前,计算机系统将用户可能关心的信息主动发送给用户,使用户的体验更加的个性化,效率也提高了。将推送结合进“Baidu知道”的步骤如下:

  1. 分析问题的语义信息。当用户提出问题时,计算机系统首先分析问题的语义信息,比如“华南虎灭绝了吗”,计算机可能分析出:华南虎-》大型猫科动物,灭绝-》珍惜动物保护,自然保护区,甚至和新闻相结合推断出-》周正龙。这种语义分析可以使得问题的粒度更细,这是分类系统所无法以较低成本提供的。
  2. 系统进一步分析这个问题可能哪类人可以解答:猫科动物专家?保护野生动物基金会?林业部?记者?
  3. 系统找到这些人都是谁。“Baidu知道”的用户在注册的时候应该提供一份可以解决问题的描述,或者系统根据他过去的回答情况,提取关键特征,得到一个特征向量。这样猫科动物专家-》中科院动物所-》Mr. Right;野生动物保护-》华南虎保护基金会;balabala...
  4. 最后就是推送了,这里可以有多种方式,专家们可能喜欢Email,那么系统就Email他有个问题需要他帮忙。有人安装了Baidu Toolbar,那么可以直接推送到浏览器里。其余的流程,激励机制就没有必要改变了。
很多人会说,问题并不一定只有专家才能解答,生活上的问题人人都是专家。是呀,这里提到的问题只是针对特定需求,比如专业问题,需要高效率的时候才是需要的。以计算机的角度分析,问题的关键是如何做语义分析和推导。即步骤2和3。

OK。这个问题报告完了,说的很罗嗦,你觉得这个有意思欢迎和我讨论,尽管我可能并没有机会去进一步研究他。

盛世出猛虎,猛虎显国威,国威值百万,百万要掉头。

1 条评论:

一一 说...

语义分析,新浪的爱问很早以前就能做到了,准确率虽然达不到100%,但也还不错。百度知道,没怎么用得太仔细。

或许百度应该考虑把百度知道产品这个和其他产品结合得更加紧密一些?或者扩展它的功能?