海量“相关新闻检索系统”网站运营成本降低有捷径
作者:小山 人气:
【字体:大 中 小】
发布时间:2006-08-24 16:07:55
继《天津日报》、《今晚报》两大媒体的网络版使用海量“相关新闻检索系统”之后,海量公司(www.hylanda.com)再度与国内知名新闻网站“北方网”合作,为该网站提供“相关新闻”检索技术。海量相关新闻检索系统的超强“智能化”,从此将把网站编辑们从枯燥的手工添加新闻中彻底解脱出来。休 闲 居 编 辑
海量“相关新闻检索系统”网站运营成本降低有捷径
文/小山
为争夺网民新闻点击量,所有门户网站不仅增加对硬件设施的投入及管理,而且及时安装开发最方便的新闻采集软件,并将“相关新闻”(也称“相关链结”)部分,进行人工编辑,以增大网站点击量。
对此,北京海量在线公司总裁王革焰说:“网站链结相关新闻的过程,是可以交由计算机去自动完成的,以前由于技术不成熟,没有相关产品,网站编辑们一直手工从事这项机械而繁琐的工作,浪费了大量的时间。现在,基于海量全球领先的中文信息处理技术开发的“相关新闻检索系统”,将使网站的每位编辑至少节约他们每天1/8的工作量,使编辑们有更多的时间采编出更好的文章。”
“色网第一案”与新闻点击率
新闻的相关链接是新闻服务的主要功能,大多数的新闻浏览者会点击相关新闻。当今几大门户网站如搜狐、新浪、网易、TOM都提供了此项功能,并大大增加了点击率,极大地满足了人们的阅读要求。
对于所有的网站来说,称“点击率”是其企业生命线毫不为过。前不久,中国“色网”——成都“凤鸣色情网站"案,使“点击率能否成为量刑依据"成为争论的焦点,看来,对网站点击率的关注程度,开始上升到法律层面。
实际上,几乎所有的网站,为了“争名获利”,把心血全部都用在“如何提高网站的点击率”上。除了被谈论得最多的以上传达“色情”图片等非法手段吸引点击率外,“新闻”,是几乎所有网民关注的焦点。由此可见,网站点击率的重要性可想而知。
“新闻点击率”直接反映网民表达对某一事件关注度,尤其是在国内外重大事件期间,“新闻”点击,几乎成为互联网“霸主”。在奥运会开幕不到一周时,中国新闻大战也在与雅典赛事同时升温,搜狐、新浪等奥运频道的日点击率纷纷过亿,而各大门户网站的奥运投入也将达到亿元左右;另据估算,奥运期间北京媒体广告的收入将达6亿元,预计各大媒体的奥运专题节目或栏目将实现税收5000万元。可以说,这些巨额的收益都依赖于网民新闻点击数量。正是因为点击率直接或者间接所带来的巨大商业效益,使几乎所有知名或者欲跻身知名网络界的网站经营者们,想尽一切办法提高点击数量。“相关新闻”即是其中最有代表性的一项服务功能
争取一小时
目前,手工完成“相关新闻”的链结工作,是所有网站编辑们的一项基本工作。然而,相关新闻全人工或半人工的实现方式,高额的成本使中型媒体网站望而却步。当前,以新浪为首的所有知名网站,实际上都是通过这种方法以完成这部分工作的。
近日,笔者给朋友——就职于某著名网络媒体的李编辑,算了一个账。李编辑稿件每天平均数量为60篇,他处理每篇稿件耗时1—2分钟,那么每天至少需花费1—2小时的时间来完成这部分工作,这中间输入“关键字”来完全“相关新闻”链结的时间最少为1分钟,60篇稿件最少需要1小时以上的时间,按每天八小时工作日来计算,李编辑花在编辑稿件的时间,至少占到工作日的1/8,且在此过程中,他必须得不间断工作及高度集中精神,不能因其他任何事而中断自己的编辑思路。客观地计算结果应该是,他每天在处理稿件的时间至少需花费2小时。
李编辑说,除了编辑文稿以处,其他时间他更大的精力都用在对新闻和专题的策划及采写上。这就是为何每次笔者约会他时,都能听到从电话那头传来他几乎“奄奄一息”疲惫声音:“费话少说,我都快忙死了,累死了......。”
网站的新闻编辑工作至于这样疲于奔命吗?对此,笔者一直心存疑惑。何不改变这一现状,还编辑们哪怕一小时的喘息时间。
海量技术 轻松减低网站成本
采用海量公司(www.hylanda.com)“相关新闻检索系统"后,通过计算机完全可以省略掉编辑的这部分工序。编辑只需上传新闻稿件,与所编辑稿件的相关新闻则自动由该系统处理生成,可以每天为编辑节约至少一小时的工作时间,而且免却忍受这个乏味的过程。
另外,该技术产品还可以将原来基于关键词所获得的过于粗糙的结果,转变为完全围绕该篇新闻主要内容的结果。例如,当你点击某网站上的新闻:“北京用户可办固话停机保号业务 费用每月5元”,页面底部会出现“相关链结”(即相关新闻),你可以发现这些相关新闻有一个共同的特征,即每条新闻标题都含有四个字“停机保号”,“停机保号”就是这条新闻的“关键字”,所有门户网站都采用“关键字”的手段来处理相关新闻的功能,它通过编辑输入与所编辑稿件相关联的“关键字”,以实现大量相关新闻的链结。采用海量“相关新闻”系统,得出的结果,可能让你耳目一新。当你点击进入“天津日报”网站,你可以任意打开当前一条新闻如“网络游戏 手机业务下一个金矿”,你会发现这条“相关新闻”链结部分,并非是一些只有“手机”或者“网络”关键字的新闻,它出现如下所有与该条“新闻内容”有绝对联系的链结:
“手机游戏成为金矿 陈勇 2004-09-28
黄色游戏入侵手机(附图) 李文博 2004-08-27
运营商打起奥运牌 手机也能直播比赛 马振龙 2004-08-18
出口退税率下调激活配套产业链 傅家林 2004-06-18
浙大网新 (600797)二次重组开始 2004-04-15
玩手机游戏一次"输"了 2000元 孙瑜 2003-10-19
神奇的中国移动"百宝箱" 刘涛 2003-07-16
细心的读者很容易地看出,这不但是完全基于内容的更高一层的“智能搜索”结果,而且是计算机自动搜索的结果。这就是海量超强的“相关新闻检索系统”的魅力。为了使新闻事业更好的服务于大众,海量智能计算技术研究中心通过三年的研究,采用中文智能分词技术、以贝叶斯统计模型为核心的文本主题分析技术,开发出“相关新闻检索系统,产品以软件包的形式提供给海量的合作伙伴,帮助合作伙伴先入为主快速抢占网络市场。
附:海量相关文档产品
支持的平台:
widows:推荐使用Windows2000 及以上版本、
Linux:REDHAT 7.0以上
UNIX:SOLARS8
支持的码制:GB2312、GBK、GB18030、Unicode
推荐配置: 1G内存,P4-2.4以上
主题词表:11万
开发接口:C/C++、Java
贝叶斯模型:经验贝叶斯统计模型:经验贝叶斯方法是20世纪50年代由H.Robbins提出的,他把经典学派和贝叶斯学派的方法融为一体,形成了经验贝叶斯(empirical Bayes)方法。贝叶斯方法的一大优点是利用了先验信息。综合各种信息是人工智能的一个关键问题,贝叶斯方法用于处理信息的综合,能够在不确定性的推理中提供一种模式和处理方法。海量相关文档基础件基于经验贝叶斯模型,利用语料库总结先验值进行开发。
关于海量
北京海量在线信息有限公司成立于1999年11月29日,是一家专注于中文智能计算技术的理论研究、技术开发并在核心技术基础上提供海量情报服务的知识创新型企业。
2000年6月承担重点攻关项目"中文智能搜索引擎系统"的开发,7月承担国家863计划课题"智能信息内容分析方法研究"。海量先后两次成功获得风险投资,为今后的长远发展奠定了雄厚的基础。
WISA是海量科技经过三年时间,成功研发的针对于各类网站的一种远程情报服务,她的出现将推动整个互联网的发展。WISA打破了以往企业网站信息单向流通的弊端,帮助企业在通过网站进行信息发布的同时,将用户访问信息通过中文智能计算技术和商业智能计算技术转化为与企业核心业务相关的竞争情报,为企业的经营决策提供7×24小时情报采集。
目前,海量科技已与新网、万网、通联无限等多家服务运营商建立了友好合作的关系,海量科技为其提供运营服务和技术支持,共同推出WISA服务。
2004年度将是WISA发展壮大的一年,也是海量科技与所有的合作伙伴共同腾飞的一年。
若想更多了解 敬请浏览:www.wisa.com.cn/www.hylanda.com