【油猴腳本】百度-原創力-人人-豆丁-道客-豆丁建筑文檔下載
【油猴腳本】百度-原創力-人人-豆丁-道客-豆丁建筑文檔下載
描述
這是一個用于 Tampermonkey 或其他支持用戶腳本的瀏覽器擴展的油猴腳本。
看到論壇經常有小伙伴們需要下載某創力文檔-某人文庫一些免費文檔,但是相關網站瀏覽體驗不好各種廣告,各種登錄驗證,需要很多步驟才能下載文檔,該腳本就是為了解決您的煩惱而誕生,盡可能做到自動化。
安裝
- 安裝 Tampermonkey 瀏覽器擴展。
- 點擊 腳本鏈接 或手動復制腳本代碼。
- 在 Tampermonkey 中創建一個新腳本,將代碼粘貼到編輯器中并保存。
原理說明
一般在線文檔有以下幾種方式展示在線文檔預覽功能:
- 將圖片繪制成畫布呈現
- 將二進制數據繪制畫布
- 多種圖片拼接頁面渲染
- 直接圖片渲染頁面
所以該腳本只是將畫布或圖片在瀏覽器渲染時進行下載拼接成PDF文件,無法下載原始文件,并非破解,只要是你瀏覽器可以看到就可以下載。宗旨就是你能看到多少,就能下載多少。
核心技術點解決一個文檔由多個域名提供圖片,解決跨域問題。
以上兩個文檔庫中的文檔,大部分文檔都是來自好幾個域名,并且有跨域問題,也就是說如果在當前頁面通過JavaScript直接下載圖片會產生跨域問題,這也是為什么網上其他腳本針對這兩個網站只能提供圖片下載地址,不能直接下載的根本原因。
解決跨域最簡單的辦法就是同源,在腳本中動態添加 iframe元素,通 iframe 內聯元素框架打開當前圖片所在域名,將需要下載的圖片當 iframe 頁面內下載,再通過 postMessage 方法將Blob 數據傳回主頁面進行保存。
當然也許有其他更好的辦法解決,此腳本只是基于JavaScript進行處理,不借助額外第三方工具(下載,合并等exe文件)處理為前提。

平臺/功能
| ?? 支持平臺 | 支持 |
|---|---|
| 百度文庫 | ? |
| 原創力文檔 | ? |
| 人人文庫 | ? |
| 豆丁網 | ? |
| 道客巴巴 | ? |
| ?? 文檔類型 | 百度文庫 | 原創力文檔 | 人人文庫 | 豆丁網/豆丁建筑 | 道客巴巴 |
|---|---|---|---|---|---|
| ? | ? | ? | ? | ? | |
| WORD | ? | ? | ? | ? | ? |
| PPT | ? | ? | ? | ? | ? |
| TXT | ? | ? | ? | ? | ? |
| ??支持功能 | 百度文庫 | 原創力文檔 | 人人文庫 | 豆丁網/豆丁建筑 | 道客巴巴 |
|---|---|---|---|---|---|
| 狀態位 | ? | ? | ? | ? | ? |
| 自動預覽 | ? | ? | ? | ? | ? |
| 停止預覽 | ? | ? | ? | ? | ? |
| 下載圖片 | ?(PPT,圖片PDF) | ? | ? | ? | ? |
| 下載PDF | ?(PPT,圖片PDF) | ? | ? | ? | ? |
| 獲取文本 | ?(WORD,可編輯PDF) | ? | ? | ? | ? |
| 打印PDF | ? | ? | ? | ? | ? |
| 獲取地址 | ? 部分 | ? | ? | ? | ? |
1->2->3 執行優先級
| 功能 | 解釋說明 |
|---|---|
| 狀態位 | 各個功能執行狀態,當前進度。 |
| (1)自動預覽 | 就是替你滾動頁面,讓所有頁面進入可視范圍內。百度文庫必須使用自動預覽功能,其他手動也行。 |
| (2)停止預覽 | 顧名思義就是停下來,別動了 |
| (3)下載圖片 | 把所有圖片打包成壓縮包下載,方便你們后續二次處理,例如:OCR識別 |
| (3)下載PDF | 把所有圖片合并導出 PDF 文件 |
| (3)獲取文本 | 文本內容 |
| (3)打印PDF | 瀏覽器本身打印功能,Ctrl+P 鍵也可以拉起來,“目標打印機處”點擊另存為PDF即可 |
| (3)獲取地址 | 把所有圖片地址導出來自己處理,不一定有數據取決于文檔類型 |
注意事項
F5刷新能解決大部分問題- 功能按鈕要依次執行不要到處亂點,需等待上一個功能執行完成再執行下一個功能
| 平臺 | 注意事項 |
|---|---|
| 百度文庫 | PDF 格式分為:可編輯,不可編輯,圖片格式,下載PDF只支持圖片格式。當遇到下載空白頁時使用打印PDF功能。可編輯PDF 文件可以點擊編輯文檔,再自動預覽打印PDF,這樣就得到了一個可以復制內容的PDF文件。支持復制文本內容和全局文檔復制功能(左上角展示當前復制內容文本框)。text 類型點擊自動預覽后點擊獲取全文即可,可以使用過打印。其他類型文件自行探索大部分都支持。 word/PDF 自動預覽后就不能復制文本了,若要復制文本就不要執行自動預覽。可編輯文檔優先使用可編輯下預覽 |
| 原創力文檔 | PPT 下載過程中如果點擊停止預覽后,想要繼續預覽全文需要刷新頁面從頭開始。全屏預覽不要縮小瀏覽器。 |
| 人人文庫 | 從側邊欄“相似文檔”點擊切換文檔可能無法下載,需要 F5 刷新后就可以了 |
| 豆丁網/豆丁建筑 | 想要獲取更多文章內容需要登錄自己賬號,默認只展示一部分內容。 |
| 道客巴巴 | 沒啥注意的 |
示例
| ?? 示例文檔 | 百度文庫 | 原創力文檔 | 人人文庫 | 豆丁網/豆丁建筑 | 道客巴巴 |
|---|---|---|---|---|---|
| 圖片格式 可編輯 | |||||
| WORD | word word | word | word | word | |
| PPT | ppt | ppt | ppt | ppt 建筑 | |
| TXT | TXT | ? | ? | ? | ? |
授權
@license Apache-2.0
兼容性
谷歌瀏覽器
注意事項
注意: 請確保遵循網站的使用條款和政策。自行承擔風險。
- 本腳本完全免費。
- 僅供學習交流,嚴禁用于商業用途,請勿傳播下載的數據。
- 本腳本所獲取的資源完全合法,與瀏覽器能直接獲得的資源一致,不存在逆向破解。
- 使用腳本造成的影響由使用者承擔。
哇!又賺了一天人民幣

浙公網安備 33010602011771號