您好,欢迎来到惠州网站建设_网页设计制作公司_高端网站建设_模板建站_欣欣仿站



模板搜索:搜索
热门搜索: ALL房产金融汽车室内设计

分析网站日志,给网站做一个健康检查 2022-03-13 10:19:30

当前位置: >首页>新闻列表>分析网站日志,给网站做一个健康检查

        网站日志相信各位站长都是知道的,他跟电脑的日志一样都是记录的东西。相当于一个记事本,飞机上叫黑匣子。当然,网站的日志就没这么神器的名字了。他就是单纯的网站日志。他记录了网站什么页面被打开了,什么时候打开的,谁来打开的,从哪个ip来的,从哪个浏览器来的,通过什么链接进来的。进来之后,网站当时反馈给他们什么信息,是错误的404,还是200,还是其他提示。还有就是可以显示返回页面的数据大小。。。作用是强大的,如果你是一个站长的话,还可以用这个日志排查出,是否被攻击了,被入侵了,有没有入侵成功等等。一句话,有这个东西,你的网站就是一个网站历史,所有的事情都会被记录。所以黑客如果进来之后,他们也会删掉他们的记录的,也会删掉日志文件。如果你发现你的日志不见了,那么就有可能被入侵了。

        言归正传,我们拿一段日志来看看,看下网站的日志要怎么看。

        1.png

        我们先看第一条

183.237.205.76 - - [13/Mar/2022:09:33:58 +0800] "GET /chanpin_495.html HTTP/1.1" 200 5618 "http://fz.tywl88.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"

183.237.205.76  这个就是当时进来访问的客户端ip地址。   [13/Mar/2022:09:33:58 +0800]   这个是来访的时间和时区。

"GET /chanpin_495.html HTTP/1.1"  表示用get的方式打开的这个 495页面。按照这个提示,就是直接访问了我们的静态产品页面。

"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"    这个是浏览器的信息和他的电脑或者手机的信息,目前这个是 win10的64位电脑访问的。是用chrome这个浏览器打开的。

        按照这个说法,大家都知道了吧。基本日志都会看了吧?那么现在我们在来看看spider的信息。什么是spider呢?这个一般是百度的说法,百度的蜘蛛。google的话,他们一般叫bot,机器人的一起。很多时候,我们分析日志的时候发现,spider一般来访都没有bot的那么勤快。很多时候,bot来了几次了,哪怕新页面,他都会来的很快。spider的话,相对的会少很多。而且很多时候,指挥来首页。其他页面很少进去的。除非你的外链够多啊,页面内容原创度够高,网站用户活跃度够高,他们才会经常来。所以,这里又要扯到优化了,那就扯远了,今天先看看日志。

        116.179.32.149 - - [12/Mar/2022:17:37:31 +0800] "GET /index.php/contactus HTTP/1.1" 200 4887 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"

        看这条记录,这个就是蜘蛛的记录了。为什么说他是蜘蛛记录呢?一般来说,我们可以搜索  spider这个来判断。或者使用三方工具来做判断。spider的英文意思就是蜘蛛。我们现在要做的事什么呢?

        看蜘蛛记录我们一般要一天,一周,一个月来看。比方说,来了哪个页面,什么时候来的,来了几次,一天几次,一周几次,一月几次。来的时候,系统有没有给返回的代码,比如,404,200,302等等,如果有的话,就要检查下为什么?怎么检查呢?惠州网站建设认为最简单的方式就是,用自己的电脑去打开他们访问的页面,然后在看看能不能打开。更专业的方法是,你打开之后,在看看,你们打开时候的哪个日志文字,对比下,有什么不同。如果有问不同,尽量弄到相同环境去测试。这样比较容易发现问题。如果是404,302这些的话,你就要调整下,让搜索引擎可以正常打开。

        很明显,上面打开的地址是我们的contactus页面,这个是我们的联系我们页面。然后返回的是200,页面大小大概是 4887。虽然,现在另一个引擎已经不再我们这里服务了。我们还是看一下吧,让做外贸站的伙伴,有个参考的数据。

        66.249.79.101 - - [12/Mar/2022:17:19:34 +0800] "GET /article_m490.html HTTP/1.1" 200 6012 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

        基本参数,跟我们上面看到的差不多。不过就是他的效率明显是比我们的要快不少。这个页面,spider来了估计不超过2次,bot基本每天来2-3次。具体是什么原因我们也不好说,姑且就认为bot的机器人比蜘蛛要勤快点吧。

        来源:欣欣仿站   惠州网站建设

点击次数:252  更新时间:2022-03-13  【打印此页
下一条:使用自己开发的正则工具,写一个匹配图片,svg,字体的正则表达式
上一条:记录一个留言板块的开发过程?
返回产品列表

扫一扫,添加微信

双十一活动季

1:签到7天,即可下载模板

2:开放包月,包年终身会员

3:包月会员,低至10元每月

4:包年会员,低至100元每年

5:终身会员,低至300元永久