Program Life

SEO工具,站长必备

内容与结构工具
搜索引擎抓取内容模拟器
可以模拟蜘蛛抓取指定网页Text,Link,Keywords及Description信息
http://www.webconfs.com/search-engine-spider-simulator.php
相似页面检测工具
检验...

Advertise Here

搜索引擎重复网页发现技术分析

(技术文章转载)
搜索引擎重复网页发现技术分析
中科院软件所 张俊林
TIMESTAMP:2006年6月1日
一. 介绍
统计结果表明,近似镜像网页数占总网页数的比例高达全部页面的...

中科院分词系统

中科院分词系统概述
  
这几天看完了中科院分词程序的代码,现在来做一个概述,并对一些关键的数据结构作出解释
〇、总体流程
考虑输入的一句话,sSentence=”张华...