2008/02/20 19:40
在一个新站上看到如下日志:
77.91.224.23 - - [20/Feb/2008:07:59:07 +0800] "GET /robots.txt HTTP/1.1" 404 408 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
77.91.224.23 - - [20/Feb/2008:07:59:08 +0800] "GET / HTTP/1.1" 200 2074 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
......
77.91.224.23 - - [20/Feb/2008:16:28:49 +0800] "GET /robots.txt HTTP/1.1" 404 408 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
77.91.224.23 - - [20/Feb/2008:16:28:51 +0800] "GET /B.htm HTTP/1.1" 200 2395 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
好像挺正规,先读robots.txt,再扫描页面。访问了一下http://www.webalta.net/ru/about_webmaster.html,找不到页面,估计被封了。
查了一下,从一大堆网页日志的搜索记录中,找出它原来是俄罗斯的搜索引擎。俄罗斯的搜索引擎跑来中国抓网页,呵呵。估计没什么用,如果扫描的量很大的话,可以考虑把它的IP屏蔽。
77.91.224.23 - - [20/Feb/2008:07:59:07 +0800] "GET /robots.txt HTTP/1.1" 404 408 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
77.91.224.23 - - [20/Feb/2008:07:59:08 +0800] "GET / HTTP/1.1" 200 2074 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
......
77.91.224.23 - - [20/Feb/2008:16:28:49 +0800] "GET /robots.txt HTTP/1.1" 404 408 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
77.91.224.23 - - [20/Feb/2008:16:28:51 +0800] "GET /B.htm HTTP/1.1" 200 2395 "-" "WebAlta Crawler/2.0 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)"
好像挺正规,先读robots.txt,再扫描页面。访问了一下http://www.webalta.net/ru/about_webmaster.html,找不到页面,估计被封了。
查了一下,从一大堆网页日志的搜索记录中,找出它原来是俄罗斯的搜索引擎。俄罗斯的搜索引擎跑来中国抓网页,呵呵。估计没什么用,如果扫描的量很大的话,可以考虑把它的IP屏蔽。
2008/02/19 14:31
今天在浏览Bo-Blog官方论坛时,发现ping服务插件。说是发表日志后,几分钟内Google的Blog搜索就能索引到,试用一下。
我下了这个版本,作者说明:http://www.zwke.cn/bo-blog-plugin-pingservce/
装完后,在自定义多个ping服务网址中,填写了2个地址:
http://blogsearch.google.com/ping/RPC2
http://rpc.weblogs.com/RPC2
发表这篇日志,看看收录情况。
发表后观察日志(服务器时间比我机子时间晚了4分钟),发表后半分钟内就来了,第一条是Adsense的,第二条可能就是。
66.249.70.103 - - [19/Feb/2008:14:32:03 +0800] "GET /post/255/ HTTP/1.1" 200 7476 "-" "Mediapartners-Google"
66.249.70.103 - - [19/Feb/2008:14:32:37 +0800] "GET /feed.php?go=entry_255 HTTP/1.1" 200 1258 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
现在再修改提交。
提交半分钟后发现:
66.249.70.103 - - [19/Feb/2008:14:51:39 +0800] "GET /feed.php?go=entry_256 HTTP/1.1" 200 434 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
日志ID才到255,怎么变成256了。。。,怀疑程序有点问题。经检查程序,确实存在修改日志时,发送的Ping地址有误。
晚上再看下,并没有像插件作者所说的能够迅速在Google的Blog搜索中索引到,可能作者的Blog比较优秀吧:)
我下了这个版本,作者说明:http://www.zwke.cn/bo-blog-plugin-pingservce/
装完后,在自定义多个ping服务网址中,填写了2个地址:
http://blogsearch.google.com/ping/RPC2
http://rpc.weblogs.com/RPC2
发表这篇日志,看看收录情况。
发表后观察日志(服务器时间比我机子时间晚了4分钟),发表后半分钟内就来了,第一条是Adsense的,第二条可能就是。
66.249.70.103 - - [19/Feb/2008:14:32:03 +0800] "GET /post/255/ HTTP/1.1" 200 7476 "-" "Mediapartners-Google"
66.249.70.103 - - [19/Feb/2008:14:32:37 +0800] "GET /feed.php?go=entry_255 HTTP/1.1" 200 1258 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
现在再修改提交。
提交半分钟后发现:
66.249.70.103 - - [19/Feb/2008:14:51:39 +0800] "GET /feed.php?go=entry_256 HTTP/1.1" 200 434 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
日志ID才到255,怎么变成256了。。。,怀疑程序有点问题。经检查程序,确实存在修改日志时,发送的Ping地址有误。
晚上再看下,并没有像插件作者所说的能够迅速在Google的Blog搜索中索引到,可能作者的Blog比较优秀吧:)
2008/02/18 19:44
13号帮朋友转Vista之家时发现的,在Google的列表中,此网站的所有页面被定义为“该网站可能会损害您的计算机"。页面中确实有恶意代码,可能是被人放了木马。检查后,将这些恶意代码统统删除了!
14号去stopbadware.org提交了重新审核的申请,看看多久能生效。今天下午Site时发现,此提示已经取消:)解除成功!
http://www.google.cn/search?q=site%3Avistaforum.com.cn
14号去stopbadware.org提交了重新审核的申请,看看多久能生效。今天下午Site时发现,此提示已经取消:)解除成功!
http://www.google.cn/search?q=site%3Avistaforum.com.cn
2008/02/15 22:33
一个框架页,当页面长度或高度超出浏览器时,则会出现左右和上下的滚动条。
其实左右不会超出,只有高度超出,但也会导致左右和上下的滚动条。现在只想要上下的滚动条,不想要有左右的。
本来的话,在CSS中定义body{overflow-x:hidden}就解决这个问题了,但是今天试了N次发现不行:(
后来,去掉了页面头部的声明,发现OK了,晕!加了Web标准还真麻烦,我又不想去掉头部的文档声明,应该有解决办法才对。搜索了一下,找到方案。
原来如此,于是以CSS中定义:html{overflow-x:hidden},问题解决:)
同时转载了一篇文章:隐藏或屏蔽IE滚动条大搜罗
其实左右不会超出,只有高度超出,但也会导致左右和上下的滚动条。现在只想要上下的滚动条,不想要有左右的。
本来的话,在CSS中定义body{overflow-x:hidden}就解决这个问题了,但是今天试了N次发现不行:(
后来,去掉了页面头部的声明,发现OK了,晕!加了Web标准还真麻烦,我又不想去掉头部的文档声明,应该有解决办法才对。搜索了一下,找到方案。
引用
当使用!DOCTYPE声明打开符合标准的模式时,overflow、overflow-x和overflow-y属性会应用于HTML元素,应用于BODY元素时无效。
原来如此,于是以CSS中定义:html{overflow-x:hidden},问题解决:)
同时转载了一篇文章:隐藏或屏蔽IE滚动条大搜罗
2008/02/14 09:43
昨天帮朋友移个站,发现代码中有被嵌了一些恶意代码,同时用GG查一下其收录情况,发现被标注为:该网站可能含有恶意软件,有可能会危害您的电脑。
移的时候就已经把那些代码去掉了,今天参考了谷歌关于“该网站可能会损害您的计算机”的说明,去http://www.stopbadware.org/home/reviewinfo提交了重新审核的申请,开始填了仍然返回原页面,后来才知道不用加www。然后点链接,一大堆说明,填了name和email,提交完提示:
等结果中。
另外,在这里可以检查是否被列入黑名单:http://www.stopbadware.org/home/reportsearch,直接输域名,不用加www。
移的时候就已经把那些代码去掉了,今天参考了谷歌关于“该网站可能会损害您的计算机”的说明,去http://www.stopbadware.org/home/reviewinfo提交了重新审核的申请,开始填了仍然返回原页面,后来才知道不用加www。然后点链接,一大堆说明,填了name和email,提交完提示:
引用
Review Request Submitted
Thank you for submitting a request for review to StopBadware.org. We are currently reviewing a number of websites, and we have added your site to the bottom of that testing queue.
If at a later time you would like to send us additional information regarding the website you have just submitted for review, please fill out an additional request for review form for that site.
The StopBadware Team
To learn more about our reviews process, check out our FAQ and our privacy policy .
Thank you for submitting a request for review to StopBadware.org. We are currently reviewing a number of websites, and we have added your site to the bottom of that testing queue.
If at a later time you would like to send us additional information regarding the website you have just submitted for review, please fill out an additional request for review form for that site.
The StopBadware Team
To learn more about our reviews process, check out our FAQ and our privacy policy .
等结果中。
另外,在这里可以检查是否被列入黑名单:http://www.stopbadware.org/home/reportsearch,直接输域名,不用加www。







