google著手可以抓取框架內部實質意義

google著手可以抓取框架內部實質意義,這個話在曾經會有眾多人不信任,可是隨著GOOGLE讀取和抓取技術的深化


進展,到今日已經是件足以的事物!


框架頁是啥子?


就是運用一個<frame src=….)的內部實質意義,而是框架內B網站/頁的內部實質意義!


測試效果如下所述:


>
</frameset><noframes>
<body>
<script language=’JavaScript’>
window.top.location.replace(‘&#39;);
</script>
</body>
</noframes>
</HTML>


也就是在現時 A站:”index.html


“是沒有內部實質意義的只有題目”河北新鴻禧文化廣泛散布有限企業”。而我們敞開站點看到的裡面含有的B網頁:http:


//b2b.sohu.com/company/coms70/yp350235.html的內部實質意義!


不過回返到搜索最後結果你發覺到他竟至抓取的內部實質意義是”河北新鴻禧文化廣泛散布有限企業是一家著力於國內、國


際文化廣泛散布,會展展示,營銷謀劃的服務性機構。始末遵照實行”為客戶發明最大價值”的服務宗旨。企業與


中國各地政府部門、貿促會系統、外經貿系統、商人團體、七十二行協會、國際展示企業、各種電視臺等施行了廣


泛友善的 …
“sjzxhx.sohu.net/ – 43k – 網頁快照 – 大致相似網頁


也就是B網頁內部實質意義!


再次測試是否搜索的到,輕易抽檢一個針對此頁的關鍵字”企業與意大利對外商業活動委員會ICE和中國意大


利商人團體有著令人滿意的合作關系”
/search?q=百分之百E5百分之百85百分之百AC百分之百E5百分之百8F百分之百B8百分之百E4百分之百B8百分之百8E百分之百E6百分之百84百分之百8F百分之百E5百分之百A4百分之百A7百分之百E5百分之百88百分之百A9百分之百E5百分之百AF百分之百


B9百分之百E5百分之百A4百分之百96百分之百E8百分之百B4百分之百B8百分之百E6百分之百98百分之百93百分之百E5百分之百A7百分之百94百分之百E5百分之百91百分之百98百分之百E4百分之百BC百分之百9AICE百分之百E5百分之百92百分之百8C百分之百E4百分之百B8百分之百AD百分之百E5百分之百9B百分之百BD百分之百E6百分之百84


百分之百8F百分之百E5百分之百A4百分之百A7百分之百E5百分之百88百分之百A9百分之百E5百分之百95百分之百86百分之百E4百分之百BC百分之百9A百分之百E6百分之百9C百分之百89百分之百E7百分之百9D百分之百80百分之百E8百分之百89百分之百AF百分之百E5百分之百HKSEO百分之百BD百分之百E7百分之百9A百分之百84百分之百E5百分之百90百分之百8


8百分之百E4百分之百BD百分之百9C百分之百E5百分之百85百分之百B3百分之百E7百分之百B3百分之百BB&變態nG=百分之百E6百分之百90百分之百9C百分之百E7百分之百B4百分之百A2&hl=zh-CN&newwindow=1
抓取的是B頁面的內部實質意義,收錄途徑也是!


再次測試:河北新鴻禧文化廣泛散布有限企業


/search?q=百分之百E6百分之百B2百分之百B3百分之百E5百分之百8C百分之百97百分之百E6百分之百96百分之百B0百分之百E9百分之百B8百分之百BF百分之百E7百分之百A6百分之百A7百分之百E6百分之百96百分之百87百分之百E5百分之百8C百分之百


96百分之百E4百分之百BC百分之百A0百分之百E6百分之百92百分之百AD百分之百E6百分之百9C百分之百89百分之百E9百分之百99百分之百90百分之百E5百分之百85百分之百AC百分之百E5百分之百8F百分之百B8&hl=zh-CN&newwindow=1


仍然B網頁內部實質意義!


再再次測試:site:sjzxhx.sohu.net


/search?hl=zh-CN&newwindow=1&q=site百分之百3Asjzxhx.sohu.net&變態nG=Google+百分之百E6百分之百9


0百分之百9C百分之百E7百分之百B4百分之百A2&lr=


由於”sjzxhx.sohu.net域下沒有其它頁所以就是這樣一個最後結果!
不過你仍然看家他爪取的內部實質意義是框架裡的B頁內部實質意義!


以上幾個測試仍然最終這個測試更具有代表性!


在百度:site:sjzxhx.sohu.net


/s?ie=gb2312&bs=iis+百分之百D6百分之百D0百分之百CE百分之百C4百分之百D3百分之百F2百分之百C3百分之百FB&sr=&z=&cl=3&f=8&wd=site百分之百3As


jzxhx.sohu.net&ct=0


也成功實現了此技術!


搜索:河北新鴻禧文化廣泛散布有限企業


看到抓取的內部實質意義是B頁的內部實質意義。顯露的途徑卻是sjzxhx.sohu.net,在GOOGLE則是丟開了sjzxhx.sohu.net


而顯露的是框架裡的頁的完全途徑!


以上測試你發覺了啥子?和曉得怎麼去做了嗎?


你需求研討下哪一個筐架代碼至少!


曾經會發覺搜索後的內部實質意義顯露局部是”……”


譬如:/s?ct=0&ie=gb2312&bs=百分之百BF百分之百A7百分之百B7百分之百C8百分之百BC百分之百D3百分之百C3百分之百CB&sr=&z=&cl=3&f=8&wd=百分之百


CE百分之百DE百分之百CE百分之百FD百分之百D0百分之百C5百分之百CF百分之百A2百分之百B8百分之百DB


至少也是”本網頁運用了框架,但您的瀏覽器不支持框架。請下載新的瀏覽器特意的看。”


想想是不是呢?


如今你要優化框架型網頁,那末你的辦法該怎麼執行,飄哥無須多說你也該清楚了吧,有沒完解的諮詢QQ:19379458


過載請著明來源:/article.asp?id=84