<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      前后端分離項(xiàng)目做爬蟲收錄,提供蜘蛛爬行最簡單方案,創(chuàng)建sitemap xml

      2024年5月13日11:36:01

      現(xiàn)在很多項(xiàng)目是vue react angular開發(fā)的,但是百度爬蟲對(duì)這樣的項(xiàng)目支持不好,很多時(shí)候回去采用一些 服務(wù)器端渲染(SSR)靜態(tài)站點(diǎn)生成(SSG) ,當(dāng)然有些框架支持ssr和ssg效果不好,還有些想不不破壞項(xiàng)目自身的提前下的方案呢?

      參考:https://blog.csdn.net/andy_68147772/article/details/135118183

      很多年前接手一個(gè)angularjs的項(xiàng)目,但是要搞爬蟲收錄,搞了好久那個(gè)時(shí)候ssr支持的不太好,所以想了另一個(gè)方法。

      爬蟲是會(huì)先爬取 http://127.0.0.1/robots.txt 去讀取爬蟲規(guī)則的,這里面是可以指定stemap xml地址的
      例如:

      User-agent: *
      Allow: /
      Sitemap: https://www.xxx.cn/express.xml
      Sitemap: https://www.xxx.cn/lastest.xml
      Sitemap: https://www.xxx.cn/sitemap1.xml
      Sitemap: https://www.xxx.cn/sitemap2.xml
      Sitemap: https://www.xxx.cn/sitemap3.xml
      Sitemap: https://www.xxx.cn/sitemap4.xml
      
      

      sitemap規(guī)范
      https://www.sitemaps.org/protocol.html#index

      如果有sitemap的地址,爬蟲就會(huì)去讀取sitemap

      <?xml version="1.0" encoding="UTF-8"?>
      <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
         <url>
            <loc>https://www.xxx.com/page1</loc>
            <lastmod>2023-01-01</lastmod>
            <changefreq>daily</changefreq>
            <priority>0.8</priority>
         </url>
         <url>
            <loc>https://www.xxx.com/page2</loc>
            <lastmod>2023-01-02</lastmod>
            <changefreq>weekly</changefreq>
            <priority>0.6</priority>
         </url>
         <!-- more URLs... -->
      </urlset>
      
      

      那么就可以直接在get的頁面的內(nèi)容接口直接放在地圖,讓蜘蛛直接獲取接口返回的json內(nèi)容,就不需要渲染,達(dá)到讓不使用ssr,ssg來讓爬蟲爬取內(nèi)容的方法。

      laravel支持的sitemap生成工具

      composer require spatie/laravel-sitemap
      

      如果內(nèi)容過多,建議分拆xml文件 Sitemap: https://www.xxx.cn/sitemap4.xml 文件,不然一次太大影響爬蟲獲取接口返回的時(shí)候,注意http頭時(shí)json格式。

      會(huì)去求證一下百度蜘蛛爬蟲是否可行,我們當(dāng)年是可以的,因?yàn)榕老x技術(shù)一直在變,最好找官方支持一下。

      posted on 2024-05-14 13:50  zh7314  閱讀(175)  評(píng)論(0)    收藏  舉報(bào)

      主站蜘蛛池模板: 免费无遮挡无码永久在线观看视频| 日日躁狠狠躁狠狠爱| 亚洲国产精品久久久天堂麻豆宅男| 强奷漂亮人妻系列老师| 色综合久久综合香蕉色老大| 国产精品中文字幕久久| 最新亚洲人成网站在线观看| japanese边做边乳喷| 国产午夜精品福利免费看| 巨胸不知火舞露双奶头无遮挡| 沧州市| 亚洲精品成人片在线观看精品字幕 | 亚洲一二三区精品与老人| 亚洲av无一区二区三区| 无码专区视频精品老司机| 成人亚欧欧美激情在线观看| 国产精品亚洲综合久久小说| 亚洲国产良家在线观看| 国产精品美女乱子伦高| 色综合 图片区 小说区| 国产成人精品午夜在线观看| 亚洲激情一区二区三区视频| 在线视频中文字幕二区| 久久波多野结衣av| 久久国产免费观看精品| 国产精品无码av不卡| 国产精品国产三级国产午| 大香蕉av一区二区三区| 国产精品露脸视频观看| 实拍女处破www免费看| 国产成人拍国产亚洲精品| 久久久久亚洲av成人网址| 精品久久久久无码| 国产成人久久综合第一区| 亚洲永久精品一区二区三区 | 国产精品一起草在线观看| 极品美女aⅴ在线观看| 亚洲精品一区二区妖精| 秋霞人妻无码中文字幕| 亚洲国产一区二区三区久| 精品国产午夜福利在线观看|