<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      C#通過WebBrowser快速扒站思路積累大量著陸頁列表

      現在工作方向已經越來越傾向于項目產品運營相關的東西。對線上運營也有了一定程度的了解。

       

      配合一些技術性的操作,能極大的便利工作中的各種高難度任務,快速提升自我,積累豐富的經驗和資源。

       

      以近期制作LP為例,在沒有任何經驗的情況下,需要快速和設計溝通制作著陸頁,中間遇到了一些經驗上不足,于是到處找各種別人家的著陸頁研究別人的思路和做法,積累一些活動著陸頁,對工作是有比較大益處的。參考別人的東西越多,才能做出更厲害的東西出來,凡事盡量往極致上靠近。

       

      于是花了一整天的時間,基于瀏覽器,制作了一個扒站工具,把看到的一些好一點的著陸頁全部down到本地,快速瀏覽和研究學習。

       

      市面上已經有很多扒站的工具,包括最原始的teleport,后來的都客扒站工具、模板小偷、網頁小偷、網頁提取助手什么的?;旧隙际褂眠^,基本上都不能完整的把CSS、腳本、圖片有效下載回來,按我要的格式存放。

      以我在新浪上發現的一個懶財網的著陸頁為例:

      1

      我想要的是這樣的結果。

      著陸頁名稱為index.html,CSS,圖片和JS分別給我歸類存到指定的目錄,再到根目錄下面標記一個txt文檔,告訴我當時這個著陸頁我是哪個網址下載回來的。

       

      最后做出來的程度的界面是這樣的

      2

       

      做的非常粗糙,只有一個分析并抓取和一個C#的WebBrowser可以用。

       

      程序會自動下載相關的數據,并存到相關的目錄,生成需要的文件。

       

      為什么不用普通的直接獲取源代碼的方式直接下載HTML呢。

      1、是HTML里面解析相對路徑和絕對路徑非常 非常 非常麻煩,需要正則表達式一個個匹配,并替換成本地路徑。

      2、是一些情況下,瀏覽器匹配出來的結果或許會更精確一點,實現上應該是更簡單的。

       

      代碼流程:

      1、瀏覽器載入著陸頁,等待載入完成。

      2、遍歷所有節點

      圖片,就下載,保存,并替換為本地路徑,腳本同樣,CSS同樣。最后處理著陸頁內嵌入的style格式的源碼。

      最后,打開CSS文件,用正則匹配圖片連接并下載遠程圖片,替換CSS里面的圖片地址。

       

      貼上解析CSS里面的圖片并下載到本地的代碼。其余都是比較簡單的。

              /// <summary>
              /// 解析CSS源碼里面的圖片,下載,并轉換為本地格式的鏈接
              /// </summary>
              /// <param name="content">CSS文件內容</param>
              /// <param name="cssUrl">CSS文件路徑,用于轉換為圖片絕對地址下載</param>
              /// <returns></returns>
              public string ParseImgInCSS(string content, string cssUrl = "")
              {
                  Regex reg = new Regex(@"url\((.*?)\)", RegexOptions.IgnoreCase);
      
                  content = reg.Replace(content, (match) =>
                  {
                      string imgUrl = match.Groups[1].Value;
                      imgUrl = imgUrl.Replace("'", "").Replace("\"", "");//替換'和雙引號,因為URL匹配是可能帶引號的
                      imgUrl = HtmlHelper.GetUrlRelative(cssUrl, imgUrl);//修復路徑為絕對地址
                      if (!string.IsNullOrEmpty(imgUrl))
                      {
                          //遠程圖片下載保存到本地
                          var localImage = Path.Combine("images", HtmlHelper.GetFileNameInUrl(imgUrl));
                          DownloadHelper.DownloadFile(imgUrl, Path.Combine(SaveFolder, SiteFolder, localImage));//下載到本地
                          if (cssUrl.ToLower().IndexOf(".css") > -1)
                          {//代表是CSS文件,會存到CSS目錄,需要使用相對地址
                              return @"url('../" + localImage.Replace("\\", "/") + @"')";
                          }
                          else
                          {//代表是頁面內部的CSS,不需要切換為相對路徑
                              return @"url('" + localImage.Replace("\\", "/") + @"')"; ;
                          }
                      }
                      return match.Value;
                  });
                  return content;
              }

       

      最后加上注釋用了100行代碼完成了整個扒站工具。

       

      還有很多地方可以完善,不過已經可以投入使用。1分鐘扒個幾個站的著陸頁是沒問題了,準備抽空去各家p2p網站的百度推廣扒他們的頁了。。。

      扒了10個LP,目錄還沒發現問題。要是有機會再包裝一下出售。

       

      會搞的人,可以自己玩玩,思路已經有了。

       

      更多精彩內容,訪問小五博客http://www.lingdonge.com

      posted @ 2015-09-04 03:01  青塬科技  閱讀(367)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 91精品午夜福利在线观看| 综合偷自拍亚洲乱中文字幕| 久久久久久性高| 国产偷拍自拍视频在线观看| 高清无码爆乳潮喷在线观看| 久久久精品波多野结衣av| 国产成人综合在线观看不卡| 国产91成人亚洲综合在线| 国产高清一区二区不卡| 丰满少妇在线观看网站| 熟女乱一区二区三区四区| 丰满少妇被猛烈进入av久久| 国产精品中文第一字幕| 一亚洲一区二区中文字幕 | 强奷漂亮少妇高潮伦理| 成人亚洲av免费在线| 亚洲一区二区三区在线播放无码| 精品一区二区亚洲国产| 青草视频在线观看视频| 亚洲色偷偷偷网站色偷一区| 亚洲欧美人成网站在线观看看| 2019nv天堂香蕉在线观看| 久久欧洲精品成av人片| 久久蜜臀av一区三区| 久久视频在线视频| 国产老熟女国语免费视频| 国产成人一区二区三区免费| 高h纯肉无码视频在线观看| 一个色综合国产色综合| 九九热在线观看视频精品| 国产91小视频在线观看| jizz国产免费观看| 成人精品一区二区三区四| 国产极品美女高潮无套| 思热99re视热频这里只精品| 99精品国产一区二区三| 国产精品一码二码三码| 亚洲综合无码一区二区| 少妇人妻av毛片在线看| 九九热中文字幕在线视频| 久久成人国产精品免费软件|