seo之google sitemaps

2011年8月17日 发表评论 阅读评论

         首先:我们先了解一下SEO的概念,SEO的中文意思是搜索引擎优化。通俗理解是:通过总结搜索引擎的排名规律,对网站进行合理优化,使你的网站在百度和Google的排名提高,让搜索引擎给你带来客户。深刻理解是:通过SEO这样一套基于搜索引擎的营销思路,为网站提供生态式的自我营销解决方案,让网站在行业内占据领先地位,从而获得品牌收益。

          对于SEO的优化不是一蹴而就的,百度百科关于SEO词条的编缉者给予SEO的优化8条建议,分别如下:1、关键词分析(也叫关键词定位)  2、网站架构分析  3、网站目录和页面优化 4、内容发布和链接布置  5、与搜索引擎对话 6、建立网站地图SiteMap   7、高质量的友情链接  8、网站流量分析 对于以上八条不再一一说明,因为所有内容不可能在文中一下说明白(况且本人知识有限,可能也说不清楚,还是不献丑了,呵呵……),本文今天主要涉及的是第6条,当然第5条也有所涉及。

        下面就重点讲下google sitemaps,Sitemap 是一种站点地图协议。加入了Sitemap文件的网站将更有利于搜索引擎网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度.用户通过提交Sitemap将明确告知搜索引擎,希望自己网站的哪些页面被收录。Google  Sitemaps 是您向 Google 索引提交所有网址并详细了解您网页在 Google 可见度的一条捷径。通过 Google Sitemaps,Google 始终可以自动得到您所有网页的信息及您更改网页的时间,帮助您提高在 Google 抓取中的覆盖率。 后台文字显示的语言,更改语言之后,退出后台重新登陆即可生效。

Google 定义的 sitemap格式如下:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/09/sitemap.xsd"   xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
     <loc>http://www.361way.com/</loc>
     <lastmod>2011-08-11</lastmod>
     <changefreq>daily</changefreq>
     <priority>1.0</priority>
   </url>
</urlset>

就是说参照上面格式定义一个.xml文件即可。
priority:相对于其他页面的优先权 url:相对于前4个标签的父标签  urlset:相对于前5个标签的父标签loc:文件连接地址
lastmod:最后修改日期
changefreq:页面内容更新频率,更新时间单位 "always"(始终), "hourly"(小时), "daily"(天), "weekly"(星期), "monthly"(月), "yearly" "never"(从不)
最终格式如下:

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><url>
                <loc>http://www.361way.com/</loc>
                <lastmod>2011-08-16T09:21:53+00:00</lastmod>
                <changefreq>daily</changefreq>
                <priority>1.0</priority>
        <url>
                <loc>http://www.361way.com/shc/122.html</loc>
                <lastmod>2011-08-16T09:21:53+00:00</lastmod>
                <changefreq>monthly</changefreq>
                <priority>0.2</priority>
        </url>

        <url>
                <loc>http://www.361way.com/xampp/1.html</loc>
                <lastmod>2011-08-16T08:26:32+00:00</lastmod>
                <changefreq>monthly</changefreq>
                <priority>0.5</priority>
        </url>

        <url>
                <loc>http://www.361way.com/find/37.html</loc>
                <lastmod>2011-08-16T08:26:16+00:00</lastmod>
                <changefreq>monthly</changefreq>
                <priority>0.2</priority>
        </url>

然后将这个sitemap.xml文件提交到GoogleSitemap。

      向google提交 sitemap的方式有多种,这里重点介绍两种,第一种:使用已注册的google帐户或重新注册一个goole帐户

 

 

 

注册完成登录后,通过站长工具提交网站站点。提交完成后,google会生成一个html页面要求上传到网站目录进行范文确认。

确认成功后,再点提交sitemap输入刚刚写好的sitemap.xml文件在你网站的位置,如我的提交的就是

http://www.361way.com/sitemap.xml,等待google确认后生效,然后再在站点根目录建立robots.txt文件

具体也可以参看我的www.361way.com/robots.txt

第二种方法是:安装软件Google Sitemap Generator(目前还是beta版)下载地址为:http://code.google.com/p/googlesitemapgenerator/downloads/list  ,支持windows、linux、linux64系统,配合apache日志生成sitemap地图供google搜索分析。

# cd sitemap-install
# ./install.sh

按2下回车,然后阅读协议,按 Y 接受,开始安装向导。

# What is the location of the Apache binary or control script? []
输入 apachectl 的路径,这对应你 Apache 安装的路径。例 /usr/local/apache2/bin/apachectl

回车后返回以下检测到的信息:

The following information about your Apache installation has been detected:
  * Apache version: 2.2
  * Apache architecture: 32 bits
  * Apache root configuration file: /usr/local/apache2/conf/httpd.conf
  * Apache group: apache
***************************************************************************
Is all of this information correct? If you answer No, installation will
terminate and you’ll need to restart the installation, using the necessary
command line options. [N/y] Y

确认信息,按 Y 继续。

—————————————-

Google Sitemap Generator will start creating Web Sitemap files as soon as it
starts up. Do you want Google Sitemap Generator to start submitting these
files automatically? There are three options:
1.  First installation. Start with automatic submission disabled.
2.  First installation. Start with automatic submission enabled.
3.  Reinstallation. Use the old automatic submission settings.

Specify your choice [1]:2
选择安装及启动方式,我选择第二个,第一次安装,开机启动,以及自动开始 Sitemap 生成。

—————————————

Apache configuration successfully updated.
Old configuration is saved at /etc/google-sitemap-generator/httpd.install.conf

安装向导把 httpd.conf 修改了,其实是在其最后一行加入了个 include 引用。
并且在修改之前自动把该文件复制到 /etc/google-sitemap-generator/httpd.install.conf。
如果卸载 Google Sitemap Generator ,卸载程序会把该文件复制回去。

Ready to set the password for the administration console.
Password (5 or more characters):
Confirm password:
设置密码,至少五位。

—————————————–

Google Sitemap Generator daemon successfully started.
To start the Google Sitemap Generator module in Apache, you must restart Apache.
After you restart Apache, you can go to http://<this-server-address>:8181/ to
configure the application.
Google Sitemap Generator (Beta) was successfully installed.

安装完毕
Google Sitemap Generator  的程序以在后台运行。
程序真正运行,需要重新启动 Apache 令 mod_sitemap 跟配置文件起效。
重启 apache 后在本机访问 http://127.0.0.1:8181  再输入你刚才安装时候填写的密码即可登录。

因为安全规则,默认 Google Sitemap Generator   是不允许远程连接的,会提示 Remote access is denied. 

若要开启远程访问可以按下面的步骤进行
进入其默认安装路径 /usr/local/google-sitemap-generator/bin
执行以下命令
# ./sitemap-daemon remote_admin enable
这么就能打开远程登录权限
在本地中重新输入:http://服务器的IP或域名:8181  即可打开登录页面。

一进入,就会显示你在 Apache 上所配置的所有虚拟主机的名称。
理应对应主机头,个个都不一样,但如果发现个个都是 Localhost 或者都跟 httpd.conf  中的ServerName 名字一样,
请在 各个虚拟主机配置中另外加入 ServerName,例如:

<VirtualHost *:80>
    ServerAdmin 你的邮箱
    DocumentRoot /var/html/www #你网站的位置
    ServerName www.361way.com   #你站点的域名
    ServerAlias www.361way.com
</VirtualHost>

如果 httpd.conf 的配置有修改,例如增加删减了虚拟主机,除了Apache 要重启外。
Google Sitemap Generator 也需要重启,方法是
进入 /usr/local/google-sitemap-generator/bin
# ./sitemap-daemon service restart

顺便说停止跟开启的方法:
# ./sitemap-daemon service stop
# ./sitemap-daemon service start
主机头配置:

第一页是该主机头的运行状态。

默认开始了 Webserver filter 收集。
你还能开启下边的 Log parser 日志分析。
文件扫描器 File scanner。
Pathname for log file(s)  填入服务器上属于该主机头 httpd 日志的地址。
Webserver filter  [ √ ]
Log parser             [ √ ]

把上边2个勾了save后就行了。

 

 

这个选项页就完成了,然后下一步。

到左边 Sitemap types
首先来到 Web
这一项相当重要,Google Sitemap Generator  会按照 Apache httpd.conf 的配置找到主机对应的程序根目录。
并且在该目录下生成 sitemap 地图文件已供搜索引擎抓取,顺带生成 robots.txt  ,如果该文件已存在,
就往最后+一句指向该域名根目录下的 sitemap 文件地址。

下边来设置参数:

首先是 schedule ,配置的是更新的频率。
1小时到一天随你,至于抓取结果怎样,还真有待研究。

Sitemap file settings 是配置 Sitemap 的文件名,随你改,还有就是记录行数,跟大小。
文件体积越小,有利于 Google 获取的成功率。
行数多,有利于短时间内让 Google 增加收录数。(查询收录数方式,打开g.cn 输入 site:www.xxx.com)
自己衡量了。

Sitemap file submission 就是让其在 robots.txt   中加入 Sitemap 文件的路径。
我的被改完之后多加了一行:http://361way.com/sitemap.xml.gz # Added by Google Sitemap Generator

Save 保存后,Web 内容的属性就配置完成了。

如果你在 google 上有开通了网站管理员工具(上面第一种方法介绍时已提到,注册google帐户,添加网站之类的就是使用的网站管理员工具),可以将相对于的 sitemap 文件添加到配置中。
当然你不加也行,Google 跟其他搜索引擎蜘蛛 会按照 roboots.txt 自己找。

往后的 Mobile, Code Search, Blog Search 是代表不同类型网站的收录配置。
这就要看你站的内容了,如果是手机wap站,就吧 Mobile 也配上吧。有搜索引擎的,就 Code Search,剩下的是博客。

 至此,Google Sitemap Generator  的按照以及配置就说完了。

它会在服务器后台分析 Apache 的动态生成更加有效的 sitemap 供 Google ,Yahoo,Ask,Live 所获取。
理论上应该能加强你网站的 SEO 效能。
不过这个东西有个小Bug(不知道是不是google特意的) 卸载有Bug。
用其位于解压包的 uninstall.sh 程序无法卸载,提示找不到 apache.sh

sitemap-install/bin/apache.sh) can’t be found.

这么简单,再次运行 install.sh ,其会提示你是否先卸载旧版本。

Do you want to uninstall the existing version first? [Y/n]

选择 Y 它就会把所有程序都卸掉。

Do you want to save the URL database and application settings file ? [Y/n]

这个按 N

然后到阅读协议的时候选择 N,退出安装向导。
然后重启 Apache 即可。

 注:以上是看了很多前辈们的经验自己测试总结出来的,如需转载请注明出处,如引用不当也请指出。




本站的发展离不开您的资助,金额随意,欢迎来赏!

You can donate through PayPal.
My paypal id: itybku@139.com
Paypal page: https://www.paypal.me/361way

分类: 开源软件 标签:
  1. 本文目前尚无任何评论.