微軟又一自動化開源王炸,Selenium 慌了!
在當今數字化時代,瀏覽器自動化工具對于開發人員、測試人員以及數據分析師等群體而言,是提高工作效率、實現流程自動化的得力助手。Selenium 作為一款經典的開源瀏覽器自動化工具,多年來在行業內占據著重要地位,被廣泛應用于 Web 應用程序的自動化測試、數據抓取等場景。
然而,今天要給大家帶來的是,微軟推出了一款名為 Magentic UI 的開源項目,這可是自動化領域的一顆“王炸”炸彈!
1、什么是 Magentic UI?
Magentic-UI,是微軟推出的一款開源的人機協作網頁自動化工具,旨在通過網頁瀏覽器實時協助用戶完成復雜的網絡任務。它基于微軟此前發布的 Magentic-One 多智能體系統和 AutoGen 框架打造,以 MIT 許可證開源。

這個工具不僅可以自動瀏覽網頁、填寫表單,還能執行代碼、分析文件,關鍵是整個過程完全透明可控。
這個自動化開源項目核心邏輯主要由Python編寫,

訪問快捷導航平臺(https://kjdaohang.com/),點擊最新上架菜單,找到Magentic-UI,點擊直達鏈接,可查看項目源碼。

2、核心功能與優勢
-
以人為中心:Magentic UI 的設計理念是模擬人類用戶的操作,而不是簡單的腳本執行。這意味著它能夠更好地處理復雜的交互場景,如動態加載、彈窗處理等。
-
協作執行,實時交互:在執行過程中,Magentic-UI 會實時向用戶播報下一步行動,同時展示所訪問網頁內容。用戶可以隨時暫停流程,用手頭瀏覽器親自驗證某一步驟,或通過自然語言反饋糾正智能體的執行路徑 。假設在數據收集任務中,智能體提取的數據與用戶預期偏差較大,用戶可即時介入,直接引導智能體調整篩選條件,確保數據準確性 。
-
智能操作: 利用 AI 技術,Magentic UI 能夠智能識別網頁元素,自動完成點擊、填寫表單等操作,大大減少了人工干預的需要。
-
學習進化,越用越智能:每次任務完成后,Magentic-UI 能對執行過程進行復盤,將關鍵步驟提煉為通用計劃并妥善保存。用戶可以隨時查看這些往昔經驗,直接套用或按需修改。當下次面對相似任務時,智能體便能基于歷史經驗迅速啟動,大大縮減任務籌備時間。
3、快速上手
首先說一下如何安裝,安裝過程非常簡單,只需幾個命令即可完成:
1、創建虛擬環境并激活(需要安裝 Python 3.10+):
python3 -m venv .venv
source .venv/bin/activate
# 如果您使用 uv 進行依賴項管理,則可以使用以下命令安裝 Magentic-UI:
uv venv --python=3.12 .venv
. .venv/bin/activate
2、安裝 Magentic-UI:
pip install magentic-ui
3、啟動服務:
magentic-ui --port8081
第一次運行此命令時,構建 Docker 鏡像需要一段時間,你可以去喝杯咖啡什么的。下次運行它時,它會快得多,因為它不必再次構建 Docker。
如果您的端口是 8081,則可以在http://localhost:8081 訪問 Magentic-UI即可使用。
Magentic-UI需要 Docker 才能運行,如果您使用的是 Windows,則需要 WSL2。建議使用Mac 或 Linux。
如果您無法設置 Docker,您可以運行有限版本的 Magentic-UI,該版本無法執行代碼、導航文件或使用命令在界面中顯示瀏覽器:
magentic-ui --run-without-docker --port 8081
如果您在構建 docker 時遇到問題,請嘗試使用以下命令重新構建它們:
magentic-ui --rebuild-docker --port 8081
接下來,就是如何使用了。

需要設置 OpenAI API 密鑰,支持 Azure OpenAI 和 Ollama 等多種模型。要使用 Azure 模型或 Ollama,請使用可選依賴項進行安裝:
# for Azure
pip install magentic-ui[azure]
# for Ollama
pip install magentic-ui[ollama]
下面,展示如何與 Magentic-UI進行分步用戶交互:
1、通過對話與 AI 一起制定詳細的任務執行步驟。

2、協同任務執行,可以隨時中斷和引導任務執行,直接通過網頁瀏覽器或對話進行干預。

3、對于關鍵操作,系統會主動請求用戶確認后再執行,支持同時運行多個任務,狀態指示器會提醒何時需要輸入或任務完成。

寫在最后
微軟 Magentic-UI 的出現,無疑為瀏覽器自動化領域注入了新的活力。它憑借創新的人機協作模式、強大的功能以及出色的安全機制,展現出了超越傳統工具的潛力。
對于需要頻繁進行網頁自動化操作的開發者來說,Magentic-UI 確實是個不錯的選擇。
它的出現給自動化領域提供了更多新的思路,不過這個工具目前畢竟剛出來不久,在生產環境使用需要謹慎考慮。
總的來說,作為一個創新的網頁自動化方案,值得試試。
如果這篇文章對你有幫助,不妨點個贊、轉發、收藏,想第一時間收到推送,記得加個星標 ?
好了,今天的分享到此結束,感謝大家抽空閱讀,我們下期再見,Respect!

浙公網安備 33010602011771號