人工智能驅動企業:通過情境感知AI重塑組織4個人生產力
4 個人生產力
Sasha 是一名手術室護士。今天是平常的一天。她正在為一位病人制定術前程序。今天的手術是標準的——疝氣手術。然而,即使是常規手術,術前程序也會因病人的既往病史和當前健康狀況而異。
制定術前計劃不僅僅是重復標準模板,它還涉及關鍵決策。Sasha 必須概述針對每位病人的具體步驟。她必須確定必要的預防措施。由于其他原因,她今天的病人正在服用血液稀釋劑。她必須通知他暫時停藥。
無論病例細節如何,Sasha 的決策過程都很復雜。它包含基于病人病史的多個信息模塊。它需要系統地得出結論。人工智能可以提供幫助。然而,在部署人工智能來幫助改進決策之前,決策者必須從信息的角度掌握這些決策是如何做出的,這一點至關重要。
上一章探討了決策的兩大支柱——感知和推理。然而,為了加深我們的理解,必須進一步解構每項任務的結構。我們將在第五章和第六章的基礎上,分別探討交互和市場的結構。
讓我們回到任務的信息結構——并通過回顧我們手術室護士Sasha的工作來說明這一點。

正如我們在第3章中提到的,感知和推理在個人決策中包括兩個不同的步驟。每個步驟都可以進一步細分。感知包括情境化階段和生成階段。情境化階段——決策過程的第一階段——是感知情境的階段。對Sasha來說,情境化涉及了解患者的具體病史以及手術要求。
情境感知AI可以在這方面提供幫助,例如,通過挖掘患者病史中的自然語言數據。但正如我們在第三章中所述,這方面的技術仍在不斷發展。現有的大型語言模型(LLM)僅具備部分感知能力,這限制了它們作為企業環境中工具的實用性。企業每天面對的復雜文檔,需要比目前大多數AI更具感知能力的AI。
讓我們回到手術室。Sasha可能會生成多個似乎適合患者的術前計劃。通常,她會運用自己的經驗和判斷力,并結合對各種情境因素的理解來生成這些選項。
Transformer 中嵌入的情境感知 AI 的生成功能可以幫助自主生成行動方案,這是決策過程中感知的第二階段。同樣,開箱即用的 LLM
可能會產生幻覺并給出錯誤的結果。因此,任何情境感知 AI 都必須基于特定領域的文檔、證據和規則,以防止出現此類結果。
推理包括選擇階段和評估階段。回到我們的例子,Sasha 必須對方案列表進行排序,并從有限的方案中選出最合適的方案。這是選擇階段,即決策的第三階段。它需要對情境和意圖有深入的理解。Sasha 可能會運用她的經驗和判斷力,并結合一些基本的決策工具,例如電子表格。使用情境感知 AI 可以進一步增強此類工具的使用。
通過將感知步驟中已凸顯的不同信息片段串聯起來,這使得選擇過程更加高效。雖然情境感知人工智能可以根據一系列標準推薦方案,但通常仍需要人類的判斷來做出最終選擇。
最后,一旦該計劃部署完成,手術完成,系統會收集不同利益相關者對此次體驗的反饋。在這種情況下,還會對術前計劃的有效性進行審查。最終,系統會對關鍵決策的影響進行細致的了解。然后,正面或負面的反饋會被回滾到Sasha的知識庫中,以便她改進未來的決策。決策過程的最后一個階段是評估。它獨立于前三個階段,但卻是整個過程中至關重要的一部分——因為它會影響未來的決策。
4.1 情境感知人工智能應用于各行各業的任務
上述基本框架可在各行各業的各種業務任務中得到應用。我們將通過以下一些案例研究來說明。
我們的目的并非提供詳細的用戶列表案例,例如咨詢公司網站上的案例。我們僅提供一小部分用例,以說明任務結構中的四個組成部分。我們大致按照情境感知能力的提升順序排列這些示例;也就是說,算法將面對越來越多樣化、不斷變化的情境。
4.1.1 農業 - 氣候田間視圖
氣候田間視圖是一個數字農業系統。它旨在通過收集、存儲和分析農民的種植面積,并提出最佳的作物和肥料組合來優化產量。它量化并分析了世界上每塊田地的獨特因素,例如地形、土壤類型、當地氣候和病蟲害水平。
基于來自衛星的大量結構化和非結構化數據、來自美國農業部的數字化農業數據、天氣數據和作物產量記錄,氣候田間視圖可以對農民的土地進行分析。它覆蓋全球2.2億英畝土地,其中1.1億英畝位于美國,占其耕地總面積的12%。
許多駕車人士都熟悉Waze,這是一款汽車路線規劃應用,它還能提醒駕駛員注意危險、超速陷阱和交通擁堵。該應用通過眾包方式從全球1.3億用戶那里獲取信息。其最新業務是拼車,利用實時數據匹配擁有相似通勤路線的用戶。
Waze擁有大量以知識圖譜形式呈現的信息,這些信息基于用戶輸入以及過去/實時交通模式的數據。這些數據是從其全球1.3億駕車人士的眾包用戶群中收集而來的。然而,并非知識圖譜中的所有內容都與特定時間和空間點的用戶相關。Waze必須提取與用戶情境最接近的圖譜信息。現在,這些信息已準備好進行進一步分析。
FieldView 利用安裝在農用車輛上的傳感器獲取的農場特定數據,根據現場地形、天氣和地下水位等關鍵指標,為每位農民的土地提出幾種可行的種植和施肥方案。
該技術配備產量管理軟件,可計算入圍各種方案的可能產量。
收獲后,該技術計算每英畝土地的實際收益。它計算實際施肥量等投入,并根據財務和環境標準評估這些投入,以評估其整體績效。
農民訂閱 FieldView。通過優化農民的產量并降低他們的財務和環境成本,FieldView 保留了其訂閱用戶,并可能獲得新的訂閱用戶。
Waze 根據各種關鍵標準生成各種路線。這些路線包括最短路線、最快路線、最低排放路線、免費路線,甚至還有避開主要高速公路的風景路線。
該應用程序根據用戶目標推薦最佳路線。它會在行程中實時更新路線,并在途中根據交通狀況的變化提供更好的替代方案。
用戶反饋可以實時評估 Waze 的推薦。當應用程序的路線選擇受到不可預見的交通擁堵或其他危險的影響時,駕駛員會同時報告。
Waze 主要通過在其推薦路線上宣傳商店和服務來獲得收入。它還通過拼車服務費獲得收入。
4.1.2 化學——用于材料探索的圖形網絡
太陽能電池板、計算機芯片和電池等現代技術需要穩定且不會分解的無機晶體。材料探索圖網絡(GNoME)是一款用于發現新材料的人工智能工具。根據《自然》雜志的一篇論文,它已經發現了220萬種新晶體。GNoME表示,這些發現包括38萬種穩定的材料,這些材料可能為未來的技術提供動力。
GNoME以知識圖譜的形式存儲了大量關于晶體的信息。從已知晶體開始,GNoME必須縮小知識圖譜中與初始晶體在語境上最接近的部分。
GNoME生成許多合成晶體配方,這些配方可能足夠穩定,可用于計算機芯片、電池和太陽能電池板等技術。
國際數學奧林匹克可以說是世界上最負盛名、也是最艱難的大學預科數學競賽。谷歌的 AlphaProof 和 AlphaGeometry AI 強強聯手,
在奧林匹克競賽中,成功解答了六道題目中的四道,這相當于銀牌得主的成績。至關重要的是,AI 能夠解答呈現給人類學生的問題。
LLM將問題轉化為符號形式,以便輕松映射到包含眾多已知數學關系的知識圖譜中。基于在此映射中,知識圖譜中與問題背景最相關的部分被分離出來。
基于知識圖譜中分離出來的這一部分,并以問題作為輸入,LLM 生成針對所提問題的可能答案。
LEAN,一個演繹推理引擎,用于驗證其候選解決方案列表。鑒于奧林匹克競賽歷史上參賽人數眾多,檢查每個解決方案將是一項艱巨的任務。因此,一個智能的
選擇必須檢查生成的晶體配方的準確性,并生成一個更短、更準確的晶體列表。
它使用數學模型來測試其提出的晶體是否真正穩定。然后,它將穩定的材料存儲在數據庫中,以改進其源材料,以供將來搜索。
GNoME 發現可以為科技行業提供裝備的材料。每一次發現都會為下一輪學習提供信息,從而創造出一個能夠自我傳播的人工智能,并持續吸引投資。該項目采用了一種名為“蒙特卡洛樹搜索”的搜索技術。該技術可以識別出正確概率最高的解決方案。
在這種情況下,由專家評判員進行人工評估。評估結果為二元對立:人工智能的最終答案要么正確,要么錯誤。數學中幾乎沒有細微差別!然而,人類評判員可能會對解決方案的優雅性和簡潔性提出一些評論。
該項目沒有經濟回報。但它確實證明了復合人工智能的有效性——并且有可能遷移到其他行業和領域。
4.1.3 零售 - SAMVID
零售商和快遞員之間的合同非常復雜。通常,合同會規定各種服務的折扣。對于人類分析師來說,識別和量化這些因素可能非常棘手且耗時。Samvid 的 AI 產品可以分析零售商和快遞員之間簽訂的合同。
LLM 將合同轉換為包含特定領域元數據的知識圖譜。此元數據層的構建考慮了潛在的用戶問題。
LLM 解釋用戶提出的自然語言問題,并生成一系列候選智能代理,這些代理帶有相應的系統提示,這些提示可能能夠回答所提出的問題。
LLM 通過將問題數據與合適的智能代理進行匹配來選擇特定的智能代理。然后,該智能代理使用問題數據,并運用從基礎到復雜的物流定價推理來回答問題。答案將返回給用戶。這些示例有助于更好地理解常見決策任務中信息處理的四個階段。
它們也讓我們很好地了解了情境感知 AI 系統如何在每個階段提供幫助。總的來說,它們通過兩種方式提升價值。
首先,它們將各個階段涉及的一些“繁重工作”自動化——例如 ClimateView 或 Samvid 示例中的情境化。這讓用戶可以騰出時間去做其他更有價值的任務。這些任務包括:專注于道路而不是費力地看地圖、尋找更多客戶,或者騰出時間對業務進行更具戰略性的思考。
其次,情境感知型人工智能系統可以快速且不知疲倦地工作,例如 GNoME 或 AlphaGeometry 的示例。因此,它們可以發現并評估人類在疲勞、無聊或其他認知受限時可能錯過的機會。事實上,在 GNoME 或 AlphaGeometry 這樣的案例中,人工智能的耐力尤為寶貴,因為它們涉及組合搜索和評估,即綜合考慮多種選項,而人類通常會覺得這令人惱火和疲憊。
參考資料
- 軟件測試精品書籍文檔下載持續更新 https://github.com/china-testing/python-testing-examples 請點贊,謝謝!
- 本文涉及的python測試開發庫 謝謝點贊! https://github.com/china-testing/python_cn_resouce
- python精品書籍下載 https://github.com/china-testing/python_cn_resouce/blob/main/python_good_books.md
- Linux精品書籍下載 http://www.rzrgm.cn/testing-/p/17438558.html
- python八字排盤 https://github.com/china-testing/bazi
- 聯系方式:釘ding或V信: pythontesting
4.2 任務剖析與人工智能失敗
我們已通過成功實施的案例展示了情境感知人工智能系統的不同功能如何映射到決策任務的剖析結構中。
然而,并非所有人工智能項目都能蓬勃發展。這就引出了一個問題:失敗的項目是否涉及與描述不同的任務剖析?還是這些案例是由于從剖析到任務的映射不匹配?在大多數情況下,我們認為是后者。當然,也存在許多組織層面的評估,實際結果會與部署人工智能之前的流程進行比較以計算人工智能系統解決方案節省的時間和/或成本。
人工智能供應商將從人工智能解決方案帶來的成本節約或收入增長中獲得一定比例的傭金。如果節省了時間,則獲得一定比例的約定等價貨幣(例如,每節省一小時可獲得 x 美元)。以及阻礙人工智能成功實施的技術陷阱。我們將在本書的第三部分中探討這些問題。現在,讓我們來分析一些值得注意的人工智能失敗案例,并從任務解剖的角度找出其中的薄弱環節。
其中一個備受矚目的案例,或許現在人工智能失敗的一個略顯濫用的例子是偽造引證。律師史蒂文·施瓦茨列舉了ChatGPT提交給他的大量案例,包括馬丁內斯訴達美航空案、米勒訴聯合航空案以及德登遺產訴荷蘭皇家航空案。問題在于,這些案例都不存在。施瓦茨被人工智能系統誤導了。他告訴紐約一家法院,他不知道該機器人可以偽造案件。施瓦茨對ChatGPT缺陷的無知最終付出了高昂的代價。他、他的同事彼得·洛杜卡以及他們的律師事務所Levidow, Levidow & Oberman因偽造引證被罰款5000美元。在這個例子中,失敗可以歸因于我們任務剖析的選擇步驟。 ChatGPT 背后的 Transformer 的工作原理是將不同的語言構建塊組合起來,從而生成與提出的問題緊密匹配的新結果。然而,這只能確保答案與問題相比看起來不錯,并不能保證答案在事實上準確無誤。為了正確使用這樣的系統,任何引用的案例都必須根據事實數據庫進行驗證。只能引用真實的案例。Schwartz 事件發生后引起了不小的轟動。然而,圣克拉拉大學臨床法學院的 Linsey Krolik 仍然保持樂觀。Krolik 認為,諸如基于律師提示的基本法律草案構建等后端流程,在未來五年內有望成功實施。正如我們將在第七章中討論的那樣,糾正此類問題相對簡單,或許可以通過使用檢索增強生成技術,并構建一個相關且全面的先例法律文件數據庫來實現。有些人工智能失誤的影響比施瓦茨如今臭名昭著的錯誤更為深遠。研究人員發現,美國醫療保健系統中廣泛使用的一種算法存在種族偏見。該算法將更健康的白人患者的風險級別分配給病情更重的黑人患者。因此,黑人患者獲得額外護理的可能性低于病情同樣嚴重的白人患者。該缺陷根植于算法本身,錯誤地將每位患者的醫療費用作為醫療保健需求的衡量標準。由于黑人患者的醫療支出低于病情類似的白人患者,該算法得出結論,黑人患者比具有相同健康風險狀況的白人患者更健康(風險也更低)。在這個例子中,失敗在于情境化。人工智能系統無法將種族差異視為支出數據偏見的來源。因此,它假設此類錯誤并不存在。
在線房地產公司 Zillow 的購房業務(即 iBuying)失敗了,因為其人工智能系統預測房價的能力不如房主本人。這并非因為它使用的數據集不準確,而是因為該數據集的應用超出了其極限。歷史的逐街價格數據忽略了對售價產生不成比例影響的關鍵變量:例如,房屋臟亂、有異味、內部布局不尋常導致買家望而卻步,或者房屋裝修過于精美。此外,這個問題持續了一段時間,給 Zillow 造成了巨額損失——盡管在這種情況下,房屋相對于其他房屋的購買價格較高,其評估起來相對容易。Zillow 的主要業務是將其購得的房屋進行小修小補后再進行轉售。這些市場交易數據本應顯示,該公司要么在維修上支出過高,要么以低于盈利所需的價格出售房屋。這是決策評估步驟的失敗。
最后一個例子是,Samvid Inc. 的聯合創始人兼首席執行官 Arun Rao 回憶起一位客戶,該客戶計劃將所有采購流程外包給人工智能。該客戶與一家大型科技公司合作,因此缺乏技術意識幾乎是沒有理由的。然而,一年過去了,很明顯,鑒于 LLM 技術的現狀,其目標是無法實現的。
該客戶希望用作輸入數據的采購文件范圍差異很大。使用現成的 LLM 無法生成達到公司所需精度水平的答案。據估計,通過知識圖譜構建適量的上下文并應用正確的隱私保護措施需要多年的時間。因此,客戶不得不縮減其人工智能雄心。最終,它只是簡單地自動化了常規流程,認為即使人工智能未能實現預期效果,也能將業務損失降至最低。這顯然是決策過程中生成步驟的失敗。使用本書中倡導的一些工具和技術來構建情境感知能力肯定會有所幫助,但公司需要評估自己是否做好了準備。我們將在第7章和第8章中討論這個主題。這些示例說明了在嘗試實施情境感知型人工智能之前,需要對業務任務中涉及的感知和推理機制有透徹的理解。
到目前為止,我們已經描述了決策任務的構成,并將其映射到成功的人工智能實現中,并通過幾個示例強調了設計失敗的點。在接下來的兩章中,我們將以此框架為基礎,來理解人與人之間的企業交互,并最終理解包含許多此類交互的市場。在此之前,我們先簡要討論如何將任務構成中的洞察映射到技術架構中。

4.3 從構成到技術架構
雖然上述關于任務構成和人工智能失敗的討論揭示了有待改進的領域,但我們需要針對情境感知型人工智能架構采取具體的行動步驟來糾正這些失敗。
在第三章中,我們討論了快速發展的情境感知技術棧,該技術棧可應用于感知和推理以完成任務。具體來說,我們討論了構建更好的知識圖譜如何提升感知能力,而創建更好的智能代理如何提升推理能力。這為我們提供了改進技術架構的路線圖。
例如,在醫療保健偏見和采購外包的案例中,失敗點與感知有關。因此,任何技術改進都必須專注于構建更好的知識圖譜,影響醫療保健示例中的情境化和采購示例中的生成。
另一方面,在法律虛假引文和 Zillow 購房的案例中,失敗點與推理有關。因此,任何技術改進都必須專注于創建更優的智能代理,影響法律示例中的選擇和購房示例中的評估。因此,分析任務解剖結構為我們提供了人工智能技術開發的指南。在本書的第三部分,我們將進一步探討情境感知人工智能技術與業務流程戰略影響之間的映射關系。
4.4 小結
- 大多數組織決策路徑都遵循一個共同的信息處理結構,該結構由四個步驟構成——情境化、生成、選擇、評估。情境感知人工智能可以通過不同的方式改進每個步驟。
- 高管必須清晰地理解這些步驟在其業務流程中的具體體現,而不是僅僅從技術角度進行理解。這有助于識別情境感知人工智能系統中潛在的設計缺陷。
- 情境感知人工智能必須完全或部分地映射到業務流程中的決策要素。這種映射使我們能夠發現人工智能實施中的薄弱環節,并有助于改進人工智能架構。知識圖譜彌補了感知階段的不足,而智能代理則在推理階段提供幫助。
浙公網安備 33010602011771號