真的需要搜索引擎吗

请记住:单独的搜索引擎不是必须的!最近的很多数据库系统都和基本的搜索引擎进行了结合。请注意几个例子:数据库的全文索引、mysq l + sphinx 的搜索数据库系统、ThunderStone 公司的TEXIS(搜索+数据库系统)。这几个做法都可以运用到顶级需求上面。

笔者推荐大家在做决定之前,先了解业内的解决方案和用户需求,然后确定你是否真的需要一个单独的搜索引擎。以笔者有限的了解来看,90%以上的用户并不需要单独的搜索引擎。

给大家举几个例子:
1)个人桌面搜索:这个应用连mysq l 都用不着出马,完全可以使用嵌入式的db 系统,如sqlite;实际应用上,据说微软的桌面搜索系统是基于Lucene 的;

2)站内搜索:BBS 网站,发帖1 万/天,pv100 万/天,搜索10 万/天。使用 mysql 的全文检索即可满足需要;

3)英文文献搜索:文献检索,数据亿级,搜索100 万/天,对检索速度有要求。可以使用mysq l + sphinx 的组合;

4)Ebay:ebay 每天检索量上10 亿,商品量上10 亿,sql 语句执行过30 亿。当初Ebay 直接在TEXIS 的基础上构建了2 维分布式系统,现在他们自己设计了一个新的简单快速智能的搜索系统:Magellan(这个名字其实是一个早年搜索引擎的名字);

5)google:上千亿数据,上百种语言,N 亿检索每天……。他们需要的技术远远超过个人的能力。