全球首个中文自然语言无线搜索引擎面市 欲与谷歌比高
[ 2007-07-30 10:17 ]

中国日报网环球在线消息:日前,美国软件和信息产业协会(SIIA)评选出了过去10年间电子商务领域10项最重要的发展成果,其中排名首位的是1998年互联网搜索巨擘Google的创立。

互联网世界的地图

谁也没有想到,源自于美国国防研究计划署(ARPA)一项计划的互联网在今天会得到如此普及的应用,诞生了无数新的服务和商业模式,改变了人们的生活方式,改变了世界。随着互联网的发展,信息也以几何级增长,据IDC的最新研究报告显示:截止到2006年,存在于互联网上的数字信息量高达1610亿GB,人们要在浩如烟海的互联网中寻找信息并非易事,以Google、百度为代表的搜索引擎无疑是互联网世界的指路明灯。

在短短的十五年间,出现了关键词搜索、多词检索和布尔检索、网络机器人、分类目录、全文搜索、相关性排序等搜索技术,目前应用最为广泛的是Google、百度为代表的关键词、分类目录搜索技术。这一技术在给人们带来方便的同时,也存在自身的不足,随着网页、信息数量的海量增加愈发明显。搜索时下热门的产品“iPhone”,在Google返回197,000,000项结果,百度返回10,800,000项结果,其中99.9%不是您想要的信息,用户还需要费时进行二次判断寻找想要的信息。原因是现有的搜索引擎技术不能理解用户搜索内容的真正含义,而是根据关键词在网页出现的频次、时间、链接数量、网页权值等指标计算后进行返回及排序。

自然语言搜索技术浮出水面

全球的搜索引擎专家都把目光瞄向了比关键词搜索更为领先的自然语言搜索技术。今年2月,位于美国旧金山的一家搜索引擎公司Powerset宣布,已经正式获得了PARC(施乐公司旗下的著名的帕洛阿尔托研究中心)所研发的自然语言处理技术的独家使用权。这种自然语言处理技术将使得Powerset搜索引擎能理解用户所搜索的关键词的含义以及多个关键词之间的关联,从而找出符合人类思维的真正的相关结果。一家由华人创办名为Lexxe的公司也对外宣布开发出面对英文的自然语言搜索引擎alpha版。而在国内,出现了Cgogo、明复、手索等新兴的搜索引擎,积极探索中文自然语言无线搜索技术。

自然语言搜索技术要解决两大问题:正确理解搜索内容的语义及在浩瀚的信息中识别相关内容并整理出正确结果,涉及到自动分词、语义识别、信息检索和内容组织等技术。而在面向中文的自然语言搜索领域,因中文的语法、句型结构、含义比英文更加复杂而被列为世界性难题。

无线搜索:起步就与世界同步

今年7月,位于深圳高新区的一信通公司宣布:已在中文自动分词、句型匹配、语义标识、数据分类和内容组织等关键技术取得重大突破,拥有4项专利技术,推出了全球首个基于中文自然语言的无线搜索引擎--Mesesoft,并在全球处于领先地位。中文自然语言搜索技术可以理解人类语言及直接反馈精准结果的特点,更加符合广大非网民的手机用户使用习惯及解决手机屏幕偏小的问题,带来良好的用户体验,这将开拓一个庞大的无线互联网搜索市场。

一信通公司新闻发言人表示:一信通专注于为中国4.6亿手机用户提供无线搜索服务,前期将搜索重点放在与手机用户日常生活息息相关的实用信息,即将开通股票、彩票、航班、火车、餐饮、酒店、天气、公交路线、企业信息等搜索服务,用户只需将搜索内容通过短信发送到特服号10661357即可得到准确结果。在后期开通基于中文自然语言的任意搜索服务。

下一个金矿:无线互联网搜索

截止2007年6月,中国网民数量达到了1.32亿人,而手机用户更是达到惊人的4.6亿,是网民的3.5倍。随着3G网络即将开通,三网合一的进程将加速,使用手机上网将成为人们的首选,口袋中的互联网必将实现。无线智能搜索将改变人们获取信息的方式,让随时随地搜索信息成为现实。手机随身携带、普及率高、费用低廉、使用简单的特点,有助于实现全民信息化。

中文自然语言搜索+无线互联网,搭建无线互联网的B2C平台,将各类企业的产品、服务与用户的搜索内容、类型关联,实现精准营销,其中蕴含巨大商业价值。据iResearch艾瑞市场咨询通过对无线搜索市场及相关行业的研究,2005年中国无线搜索市场规模为0.79亿,2006年将增长到8.90亿,比2005年增长1025.2%。受到3G产业投入商用的影响及无线搜索盈利模式的成熟,2008年中国无线搜索市场规模将达到78.5亿元并继续保持高速增长。

下一个“Google”定会出现在无线互联网搜索领域。

 

  今日选萃
 
| 关于中国日报网站 | 关于环球在线 | 发布广告 | 联系我们 | 网站导航 | 工作机会 |
版权保护:本网站登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网站独家所有,
未经中国日报网站事先协议授权,禁止转载使用。