Sitemap文件标准格式和大小说明
1、格式:
您可以采用如下三种格式的文件向360搜索提交Sitemap,文件编码可以是UTF-8或GBK:
1)标准的XML格式文件
2)文本格式文件
3)Sitemap索引文件(可同时包含多个Sitemap文件)
2、大小:
1)单个Sitemap文件:大小不超过10MB,且包含不超过50000个网址。如果网站所包含的网址超过50,000个,则可将列表分割成多个Sitemap文件,放在Sitemap索引中。
2)单个Sitemap索引文件:大小不能超过500M,如果超过请提交多个Sitemap索引文件接口。
各格式样式参见以下说明:
1、XML格式Sitemap说明
1) XML格式举例
<?xml version=1.0 encoding=utf-8?>
<!– XML文件需以utf-8编码–>
<urlset>
<!–必填–>
<url>
<!–必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 –>
<loc>http://www.xxxxxx.html/000000.html</loc>
<!–必填,URL长度限制在256字节内–>
<lastmod>2012-12-01</lastmod>
<!–更新时间标签,非必填,用来表示最后更新时间–>
<changefreq>daily</changefreq>
<!–更新频率标签,非必填,用来告知引擎页面的更新频率 –>
<priority>0.8</priority>
<!–优先权标签,优先权值0.0-1.0,用来告知引擎该条url的优先级–>
</url>
<url>
<loc>http://www.xxxxxx.html/000001.html</loc>
<lastmod>2012-12-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
2) XML标签说明
|
标签名称 |
属性 |
标签说明 |
标签类型 |
标签限制 |
可选/必选 |
|
changefreq |
/ |
标示数据更新频率 |
字符串 |
有效值为:always、hourly、daily、weekly、monthly、yearly、never |
可选 |
|
lastmod |
/ |
标示数据最新一次更新时间 |
日期 |
时间格式为yyyy-mm-dd |
可选 |
|
loc |
/ |
标示该条数据的存放地址 |
url |
最小长度1个字符最大长度256个字符以http://开头 |
必选 |
|
priority |
/ |
标示优先值 |
小数 |
[0.0 1.0](大于等于0小于等于1,保留一位小数)例如:< priority >0.8< priority > |
可选 |
|
url |
/ |
url地址的开始和结束 |
/ |
最多出现无限次 |
必选 |
|
urlset |
/ |
urlset用来标记整个文档的开头 |
/ |
/ |
必选 |
2、文本格式Sitemap说明
文本格式文件每一行写入一个网址,除此之外不包含其他信息。网址必须完整,网址中不能有换行,且包括协议头(http://)
3、使用Sitemap索引文件(对多个Sitemap文件)说明
1) 索引Sitemap举例
<?xml version=1.0 encoding=UTF-8?>
<sitemapindex>
<sitemap>
<loc>http://www.example.com/1.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/2.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
</sitemapindex>
2) Sitemap索引文件标签说明:
|
属性 |
是否必填项 |
说明 |
|
<loc> </loc> |
是 |
Sitemap位置标签,标示sitemap地址位置 |
|
<lastmod> </lastmod> |
可填 |
Sitemap修改时间标签,标示最新修改时间 |
|
<sitemap> </sitemap> |
是 |
Sitemap信息说明,标示某个sitemep的信息 |
|
<sitemapindex></sitemapindex> |
是 |
标示索引文件中所有sitemap的信息 |



