分享、学习、提高
2008/11/06 22:53
Tags: ,
前几天上了这个工具,获取网页Header信息:http://tool.itlearner.com/header.asp

有什么用呢?这里来解释下。

先查一个:www.9enjoy.com,得到:

HTTP/1.1 200 OK
Date: Thu, 06 Nov 2008 14:44:30 GMT
Server: Apache/2
X-Powered-By: PHP/5.2.6
Vary: Accept-Encoding,User-Agent
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html

服务器返回了200 OK,说明网页成功获取。并且得知了服务器是Apache2,php是5.2.6的版本。因此,它的作用是获取服务器信息,当然有些服务器管理员也可以通过某些设定来隐藏或故意设置成假的信息,所以这里获取到的服务器信息有5%的概率是假的。

再查一个图片:http://www.itlearner.com/images/logotop.jpg,得到
HTTP/1.1 200 OK
Cache-Control: max-age=86400
Content-Length: 3042
Content-Type: image/jpeg
Last-Modified: Sun, 28 Aug 2005 15:10:06 GMT
Accept-Ranges: bytes
ETag: "323fd892e2abc51:2d3"
Server: Microsoft-IIS/6.0
Date: Thu, 06 Nov 2008 15:05:00 GMT
Connection: close

说明下:这张图片最长在86400秒后过期,大小为3042字节,类型是image/jpeg,最后修改时间Sun, 28 Aug 2005 15:10:06 GMT,服务器是Microsoft-IIS/6.0。

在这些信息里,我认为最有用的反而是第一行的信息,就是获取服务器返回的状态。
也许您已经知道,在网站(页面)转移时,需要使用对搜索引擎友好的301来实现跳转,而不能使用302。如何写301跳转
因此,在这里可以检测跳转是301还是302。

如查:tools.hxstat.com/shoulu.asp,得到:
HTTP/1.1 301 Moved Permanently
Connection: close
Date: Thu, 06 Nov 2008 15:00:03 GMT
Server: Microsoft-IIS/6.0
Location: http://tool.itlearner.com/shoulu.asp
Content-Length: 0
Content-Type: text/html
Set-Cookie: ASPSESSIONIDACRCDBBA=GHCGMKHBGMEJCMCANGOCMGDN; path=/
Cache-control: private

这次我把tools.hxstat.com的内容全转到tool.itlearner.com上,也是使用了301跳转。这里就很清楚的看到了。

网上现有的这类工具,好像只能查域名,不能查某URL,我的这个就可以。
另外说明下,实现这个功能用asp实在是麻烦,最后没办法,我在php的空间上上传了一个获取的程序,asp再读这个程序获取到的内容,再返回显示出来。
2008/11/05 13:36
Tags: ,
稍微解释下:
先把要唯一的字段(我这里是licenseID)用group把多于1个的数据找出来做为b表,同时把最小的ID选中,然后于原表a表关联,把大于最小ID的数据删除。

delete hxtable as a from hxtable a,
(
select licenseID,min(id) as id from hxtable group by licenseID having count(*) > 1
) as b
where a.licenseID = b.licenseID and a.id > b.id

同理,如果要保留最新的ID,可以这样写:

delete hxtable as a from hxtable a,
(
select licenseID,max(id) as id from hxtable group by licenseID having count(*) > 1
) as b
where a.licenseID = b.licenseID and a.id < b.id

2008/11/04 22:34
Tags: , ,
原来把站长工具都放在tools.hxstat.com那边,现在打算放回itlearner那,把tool.itlearner.com原实用工具改为站长助手。

同时发现这三个排名查询都没法用了,化了点时间更新了下,已OK。

Baidu排名查询:http://tool.itlearner.com/baidu-rank.asp
Google排名查询:http://tool.itlearner.com/google-rank.asp
Yahoo排名查询:http://tool.itlearner.com/yahoo-rank.asp

其它还上了好一些功能,等都完善了再列出。


@@UPDATE@@081114
Baidu排名查询增加:当关键词不在第一页时,即在第十名以上时,增加显示第几页第几个,查询地址也是第几页的链接。比之前更方便!

2008/10/26 18:33
Tags: , ,
这个问题,在网站迁移时,如果考虑前后URL,可能会碰到。

假设Rewrite是这样的:

RewriteRule ^test.html$ http://www.9enjoy.com [R=301,L]

那么访问test.html没有问题,

本机访问,http://hx/test.html
正确的Rewrite到http://www.9enjoy.com

但访问:
http://hx/test.html?id=x
却Rewrite到了http://www.9enjoy.com?id=x
可是,我不希望有这个id=xunhappy

尝试多种方式未果。

如果带参数的URL,Redirect到一个页面,倒是可以。
RewriteRule ^test.html$ http://www.9enjoy.com/tag.php [R=301,L]
这个规则没有问题
访问test.html?id=x,照样到http://www.9enjoy.com/tag.php,正确!
但目标是目录时,就会带上参数:(


@@081027@@UPDATE

想不出其它方法,就用有参数的Rewrite到301.php,这页的内容是php写的301Redirect到目标网站。
RewriteEngine On
RewriteCond %{QUERY_STRING} ^$
RewriteRule ^(.*)$ http://www.9enjoy.com/ [R=301,L]    
RewriteCond %{QUERY_STRING} ^(.+)$
RewriteRule ^(.*)$ /301.php [L]
2008/10/18 09:32
Tags: ,
最近比较留意这两家的最近收录的页面,根据最近一个月的比较,发现了一个特点。

1.应该是最重要的区别,gg的4个选项(过去一天内,过去一周内,过去一个月内和过去一年内)都是显示的相应时间段新收录的页面。也就是说在gg里,如果该页已经被收录,最近有更新,比如在site整站时显示几小时前更新,但也不会显示在过去一天内的索引中。而Baidu的4个选项(最近一天,最近一周,最近一月和最近一年)显示的是有更新过的页面,新收录的页面和更新过的页面一些出现,但主要是更新过的页面,新收录的页面它一般要在周三才放出来。

2.Baidu的高级搜索界面没Google友好,不好描述,大家试过应该有此感觉。
分页: 4/39 第一页 上页 1 2 3 4 5 6 7 8 9 10 下页 最后页 [ 显示模式: 摘要 | 列表 ]