百度目前在站內搜索中支持5個數據模板的提交,分別是:通用、影視、小說、游戲、論壇。在實際的工作中處理過2個,所以分享下這2個的處理方法。 1、按照慣例,百度的這個提交是需要用xml地圖集的形式,先來說說游戲模板
| <?xml version=”1.0″ encoding=”UTF-8″?> | 
備注 | 
| <urlset> | 
 | 
| ??? <url> | 
 | 
| ??????? <loc>http://www.880sy.com/games/64929.html#gid.html</loc> | 
著陸頁 | 
| ??????? <lastmod>2013-01-01</lastmod> | 
文件一次更新時間 | 
| ??????? <data> | 
 | 
| ??????????? <name>*</name> | 
游戲名稱 | 
| ??????????? <url><![CDATA[http://www.880sy.com/games/64929.html#gid.html]]></url> | 
著陸頁 | 
| ??????????? <gameCategory>移動游戲</gameCategory> | 
可根據tag調整 | 
| ??????????? <gameSubCategory>手機游戲</gameSubCategory> | 
可根據tag調整 | 
| ??????????? <description>《魔獸》(World of Warcraft)…</description> | 
測試下來,站內搜索展示前140個字符正好,如果沒有字符,別忘了要技術寫個判斷加上些類似“暫無介紹”的文字,不然會報錯 | 
| ??????????? <image> | 
 | 
| ??????????????? <name>*圖標</name> | 
可以是圖片的alt標簽 | 
| ??????????????? <url><![CDATA[http://xxxxx.xxx.jpg ]]> </url> | 
游戲的展示圖片,例如手游的話是app圖標 | 
| ??????????? </image> | 
 | 
| ??????????? <datePublished>2011-12-20</datePublished> | 
游戲的發布時間 | 
| ??????????? <size>*MB</size> | 
游戲大小 | 
| ??????????? <tag>RPG,射擊</tag> | 
游戲類型,這個可以根據站點的tag標簽調整 | 
| ??????????? <developer><legalName>*</legalName></developer> | 
開發商 | 
| ??????????? <version>V2.4.0</version> | 
版本號 | 
| ??????????? <device>*</device> | 
設備類型 | 
| ??????? </data> | 
 | 
| ??? </url> | 
 | 
| </urlset> | 
 | 
| <downloadUrl><![CDATA[ http://www.wowchina.com]]></downloadUrl> | 
地址,有的話放上去,不是必填項 | 
其他注意點:整個文檔要字符串形式, 這種需要轉義,自己注意。文件量太大的話用sitemapindex索引的xml。提交后很快能在百度站內搜索中看到結果。 
 ? 這部分需要到樣式自定義里面去把游戲樣式調用出來。 
 ? 2、通用模板樣式
| <?xml version=”1.0″ encoding=”UTF-8″?> | 
備注 | 
| <urlset> | 
 | 
| ??? <url> | 
 | 
 | 
| ??????? <loc>http://ky.kaoyan.com/04/467393/</loc> | 
 | 
著陸頁 | 
| ??????? <lastmod>2013-04-10</lastmod> | 
 | 
更新時間 | 
| ??????? <changefreq>always</changefreq> | 
 | 
更新平率 | 
| ??????? <priority>0.5</priority> | 
 | 
重要值 | 
| ??????? <data> | 
 | 
 | 
| ??????????? <display> | 
 | 
 | 
| ??????????????? <title>【寫給即將上戰場的你們】努力為王,心態為皇</title> | 
 | 
文章標題,建議用頁面的title格式 | 
| ??????????????? <content>略</content> | 
 | 
可以全部提交正文,不用等蜘蛛來抓取了,注意把圖片格式,鏈接格式全部去掉 | 
| ??????????????? <tag>考研復習</tag><tag>經驗</tag> | 
 | 
根據tag標簽 | 
| ??????????????? <pubTime>2012-12-04T11:20:13</pubTime> | 
 | 
發布時間 | 
| ??????????????? <breadCrumb title=”考研加油站” url=”http://ky.kaoyan.com/”/> | 
 | 
相當于面包屑的層級關系 | 
| ??????????????? <breadCrumb title=”考研政治” url=”http://www.kaoyan.com/s/zhengzhi”/> | 
 | 
| ??????????????? <thumbnail loc=”http://docs.kaoyan.com/jpg/12/1204dde3cd949ccc.jpg”/> | 
 | 
縮略圖 | 
| ??????????????? <image loc=”http://docs.kaoyan.com/jpg/12/12048543278e760d.jpg” title=”七個常用的泰勒展開式”/> | 
 | 
文章的個圖片,默認缺省的話會調用縮略圖 | 
| ??????????? </display> | 
 | 
 | 
| ??????? </data> | 
 | 
 | 
| ??? </url> | 
 | 
 | 
| </urlset> | 
 | 
下圖是通用模板的自定義結構化因子,可以增加展示整個通用模板里還有很多其他的信息。在其中還可以看到比如discount(折扣);price(價格)等影響的因素。有興趣的可以去研究整個通用模板的數據結果,都包含在里面。
 下圖的面包屑的層級是用breadcrumb:title這個結構因子產生出來的。并且終還可以根據你的這些標簽(比如price)進行排序。 
說說重點的地方: 1、希望哪,這些提交的內容能在百度搜索引擎(不是自己的站內)結果展示上有一定的區別。
2、貌似阿拉丁百度開放平臺里提交的數據和這個有些像,之后研究下,可以的話提交行業數據試試。
							
														
							推薦閱讀