運用此開放協議,將會為您的網站帶去更多流量!

《互聯網新聞開放協議》是百度新聞搜索制定的搜索引擎網站新聞源收錄標准,網站可將宣布的新聞內部實質意義制造成遵循此開放協議的XML款式的網頁(獨立於原有的新聞宣布方式)供搜索引擎網站引得,將網站宣布的新聞信息主動、趁早地告知百度搜索引擎網站。

認為合適而使用了《互聯網新聞開放協議》,就相當於網站的新聞被搜索引擎網站訂閱,經過百度——全世界最大的漢字搜索引擎網站這個平臺,網民將可能在更大范圍內更高頻率地過訪到您網站的新聞,繼續往前為您的網站帶來潛伏的流量。

開放協議十分簡單! 您可以在我們的幫忙下輕松運用。

開放協議內部實質意義

下圖為遵從《互聯網新聞開放協議》制造的XML款式的網頁,網頁上依照標准款式列出了網站宣布的新聞的有關信息。
XML網頁舉出例子:

XML標簽解釋明白: 那裡面帶星號標記的為必選項,未帶星號標記為可選項。
*<document>——標記整個兒XML文件內部實質意義的著手和終了。
*<webSite>——站點地址。
*<webMaster>——負責擔任職務的人的Email。當有不可缺少時,我們經過這個地址與您結合。
*<updatePeri>——更新周期,以分鍾為單位。搜索引擎網站將遵從此周期過訪該頁面,使頁面上的新聞更趁早地顯露出來在百度新聞中。
*<item>——標記每篇新聞信息的著手和終了。標記內為單篇新聞信息,不涵蓋新聞專題。
*<title>——新聞題目。
*<link>——新聞url地址,與單篇新聞一一對應;若分頁的新聞存在多個URL,相當於多篇新聞。
<description>——新聞內部實質意義簡介。
*<text>——完整的新聞正文(僅裡面含有正文書契,不裡面含有HTML語言等其他字符)。此項的目標是使該篇新聞更多、更准地顯露出來在搜索最後結果中。
*<image>——新聞正文內有關圖片,認為合適而使用完全地址。若該篇新聞無有關圖片,可以為空;若包括多張圖片,請重復運用該標簽。此項的目標是使該篇新聞的有關圖片展如今搜索最後結果中。
<headlineImg>——為可能變成頭條的新聞制造的頭條圖,認為合適而使用完全地址。
<keywords>——反映新聞正題內部實質意義的一個或多個網站關鍵詞,網站關鍵詞之間以空格隔開。此項僅作為參照,檢索最後結果不絕對倚賴於此標簽中的內部實質意義。
<category>——新聞分類, 可以遵循網站自身的分類整體體系,最好認為合適而使用一級分類。
<author>——新聞筆者,可以為機構或私人 。
<source>——新聞出處,即原創電視臺或其他機構 。
*<pubDate>——新聞宣布時間,與該篇新聞HTML頁面上的宣布時間維持完全一樣。請非常准確到分鍾;若您網站的宣布時間未記錄鍾頭分鍾,供給歲月日即可。

引薦時間款式:歲月日鍾頭分鍾秒
如:2005-11-09 10:372005/11/09 10:37:002005.11.09 10:37:00
2005年十一月0九號10時37分00秒Fri, 09 Nov 2005 10:37:00 GMT


開放協議運用

運用之前您需求理解以下幾點:


  • 不管您的網站已經變成百度新聞源,仍然尚未被百度新聞搜索收錄,都可以運用此開放協議。
  • 您運用開放協議供給的內部實質意義應所有合乎下邊《新聞源收錄標准》。
  • 《互聯網新聞開放協議》只是原始新聞源收錄形式的一種輔佐和有好處補給,而不是絕對代替。


新聞源收錄標准:
百度期望新聞源多樣化,激勵原創新聞內部實質意義。若是具備數量多有價值的新聞內部實質意義並能趁早更新的正規、合法電視臺網站,且網站服務器牢穩、高速,就合乎了百度收錄新聞源的基本原則。
百度新聞搜索收錄的內部實質意義涵蓋當時的政治情況、娛樂、體育運動、財經、科學教育文化、社會形態生存等各類新聞公報及電視臺述評,數字產品、房產、交通工具等行情資訊及評測,七十二行的動態及行情,團體機構的辦公動態等,是由專業人士編撰或編輯的漢字信息,不涵蓋宣布的私人信息、論壇、博客、廣告、幽默笑話、情意故事、情色、寫真、劇照、名人檔案、食譜、下載、多電視臺等其他類型、其他語言互聯網信息。
您對付供給的所有內部實質意義承受一切法律責任,保障您供給內部實質意義的真實性、合法性,並不能進犯不論什麼第三方的權利。

下邊就著手吧!
第1步:開創XML文件
請依照上頭揭曉的開放協議內部實質意義制造XML文件。


    其他解釋明白:

  • 支持的編碼款式有GB2312、UTF-8、BIG5。
  • 您可以將網站某一時間段宣布的所有新聞放在一個XML文件中,也可以分頻帶或欄目放在多個XML文件中。
  • 請維持每個XML文件處於按更新周期連續不斷半自動更新狀況。
  • 每個XML文件至多儲存安放最新宣布的100條新聞,無須保留之前的新聞
  • 請將宣布的新聞依照時間排序,即最新宣布的新聞在最上端,否則有可能有新聞被漏下。
  • XML標簽內部實質意義中的一點特別字符務必改換為XML定義的轉義字符,否則將發生不正確造成搜索引擎網站不可以取得頁面上的新聞,具體參看下表。
































    字符 轉義後的字符
    HTML字符 字符編碼
    和(and) & &amp; &#38;
    單引號 &apos; &#39;
    雙引號 &quot; &#34;
    大於號 > &gt; &#62;
    小於號 < &lt; &#60;
    轉義字符中的”&”無須再轉。

第二步:證驗XML文件
下邊的地址供給了幫忙您證驗XML文件結構的多種工具:

經過證驗的XML文件能夠使您供給的信息更加標准,保證您宣布的新聞信息不被搜索引擎網站漏下。

第三步:提交處理XML網址
提交處理前請將XML文件上傳到您的網站服務器,將XML文件的URL地址及其他信息輸入下邊對應的方框內。搜索引擎網站將定向過訪該URL地址,當URL地址變樣時需求從新提交處理。
百度新聞搜索將對您提交處理的數值施行測試和仔細查看一周,若您基本依照 《互聯網新聞開放協議》的要求施行制造但存在問題,我們會依據XML頁面上供給的郵件地址與您結合。
注意: 百度新聞搜索不保障一定能收錄您提交處理的所有內部實質意義。