google著手可以抓取框架內部實質意義

google著手可以抓取框架內部實質意義

google著手可以抓取框架內部實質意義,這個話在曾經會有眾多人不信任,可是隨著GOOGLE讀取和抓取技術的深化

進展,到今日已經是件足以的事物!

框架頁是啥子?

就是運用一個frame src=….)的內部實質意義,而是框架內B網站/頁的內部實質意義!

測試效果如下所述:
/framesetnoframes
body
script language=’JavaScript’
window.top.location.replace(‘#39;);
/script
/body
/noframes
/HTML

也就是在現時 A站:”index.html

“是沒有內部實質意義的只有題目”河北新鴻禧文化廣泛散布有限企業”。而我們敞開站點看到的裡面含有的B網頁:http:

//b2b.sohu.com/company/coms70/yp350235.html的內部實質意義!

不過回返到搜索最後結果你發覺到他竟至抓取的內部實質意義是”河北新鴻禧文化廣泛散布有限企業是一家著力於國內、國

際文化廣泛散布,會展展示,營銷謀劃的服務性機構。始末遵照實行”為客戶發明最大價值”的服務宗旨。企業與

中國各地政府部門、貿促會系統、外經貿系統、商人團體、七十二行協會、國際展示企業、各種電視臺等施行了廣

泛友善的 …
“sjzxhx.sohu.net/ – 43k – 網頁快照 – 大致相似網頁

也就是B網頁內部實質意義!

再次測試是否搜索的到,輕易抽檢一個針對此頁的關鍵字”企業與意大利對外商業活動委員會ICE和中國意大

利商人團體有著令人滿意的合作關系”
/search?q=百分之百E5百分之百85百分之百AC百分之百E5百分之百8F百分之百B8百分之百E4百分之百B8百分之百8E百分之百E6百分之百84百分之百8F百分之百E5百分之百A4百分之百A7百分之百E5百分之百88百分之百A9百分之百E5百分之百AF百分之百

B9百分之百E5百分之百A4百分之百96百分之百E8百分之百B4百分之百B8百分之百E6百分之百98百分之百93百分之百E5百分之百A7百分之百94百分之百E5百分之百91百分之百98百分之百E4百分之百BC百分之百9AICE百分之百E5百分之百92百分之百8C百分之百E4百分之百B8百分之百AD百分之百E5百分之百9B百分之百BD百分之百E6百分之百84

百分之百8F百分之百E5百分之百A4百分之百A7百分之百E5百分之百88百分之百A9百分之百E5百分之百95百分之百86百分之百E4百分之百BC百分之百9A百分之百E6百分之百9C百分之百89百分之百E7百分之百9D百分之百80百分之百E8百分之百89百分之百AF百分之百E5百分之百HKSEO百分之百BD百分之百E7百分之百9A百分之百84百分之百E5百分之百90百分之百8

8百分之百E4百分之百BD百分之百9C百分之百E5百分之百85百分之百B3百分之百E7百分之百B3百分之百BB變態nG=百分之百E6百分之百90百分之百9C百分之百E7百分之百B4百分之百A2hl=zh-CNnewwindow=1
抓取的是B頁面的內部實質意義,收錄途徑也是!

再次測試:河北新鴻禧文化廣泛散布有限企業

/search?q=百分之百E6百分之百B2百分之百B3百分之百E5百分之百8C百分之百97百分之百E6百分之百96百分之百B0百分之百E9百分之百B8百分之百BF百分之百E7百分之百A6百分之百A7百分之百E6百分之百96百分之百87百分之百E5百分之百8C百分之百

96百分之百E4百分之百BC百分之百A0百分之百E6百分之百92百分之百AD百分之百E6百分之百9C百分之百89百分之百E9百分之百99百分之百90百分之百E5百分之百85百分之百AC百分之百E5百分之百8F百分之百B8hl=zh-CNnewwindow=1

仍然B網頁內部實質意義!

再再次測試:site:sjzxhx.sohu.net

/search?hl=zh-CNnewwindow=1q=site百分之百3Asjzxhx.sohu.net變態nG=Google+百分之百E6百分之百9

0百分之百9C百分之百E7百分之百B4百分之百A2lr=

由於”sjzxhx.sohu.net域下沒有其它頁所以就是這樣一個最後結果!
不過你仍然看家他爪取的內部實質意義是框架裡的B頁內部實質意義!

以上幾個測試仍然最終這個測試更具有代表性!

在百度:site:sjzxhx.sohu.net

/s?ie=gb2312bs=iis+百分之百D6百分之百D0百分之百CE百分之百C4百分之百D3百分之百F2百分之百C3百分之百FBsr=z=cl=3f=8wd=site百分之百3As

jzxhx.sohu.netct=0

也成功實現了此技術!

搜索:河北新鴻禧文化廣泛散布有限企業

看到抓取的內部實質意義是B頁的內部實質意義。顯露的途徑卻是sjzxhx.sohu.net,在GOOGLE則是丟開了sjzxhx.sohu.net

而顯露的是框架裡的頁的完全途徑!

以上測試你發覺了啥子?和曉得怎麼去做了嗎?

你需求研討下哪一個筐架代碼至少!

曾經會發覺搜索後的內部實質意義顯露局部是”……”

譬如:/s?ct=0ie=gb2312bs=百分之百BF百分之百A7百分之百B7百分之百C8百分之百BC百分之百D3百分之百C3百分之百CBsr=z=cl=3f=8wd=百分之百

CE百分之百DE百分之百CE百分之百FD百分之百D0百分之百C5百分之百CF百分之百A2百分之百B8百分之百DB

至少也是”本網頁運用了框架,但您的瀏覽器不支持框架。請下載新的瀏覽器特意的看。”

想想是不是呢?

如今你要優化框架型網頁,那末你的辦法該怎麼執行,飄哥無須多說你也該清楚了吧,有沒完解的諮詢QQ:19379458

過載請著明來源:/article.asp?id=84