人工智能模型能從圖像中找出規律,其效果往往比人眼更好,但并不總是如此。如果放射科醫生使用人工智能模型來幫助她判斷病人的 X 光片是否顯示出肺炎的跡象,那么她什么時候應該相信模型的建議,什么時候應該忽略它呢?
美國麻省理工學院和麻省理工學院-IB+M 沃森人工智能實驗室的研究人員表示,定制的入職流程可以幫助這位放射科醫生回答這個問題。他們設計了一個系統,教用戶何時與人工智能助手合作。
在這種情況下,訓練方法可能會發現放射科醫生相信模型建議的情況--但她不應該相信,因為模型是錯的。系統會自動學習她應該如何與人工智能合作的規則,并用自然語言進行描述。
在入職培訓期間,放射科醫生會根據這些規則通過訓練練習與人工智能進行協作,并獲得有關她的表現和人工智能表現的反饋。
研究人員發現,當人類和人工智能合作完成一項圖像預測任務時,這種入職程序可將準確率提高約 5%。他們的研究結果還表明,僅僅告訴用戶何時信任人工智能,而不進行培訓,會導致性能下降。
重要的是,研究人員的系統是完全自動化的,因此它可以根據人類和人工智能執行特定任務的數據,學習創建入職流程。它還能適應不同的任務,因此可以擴大規模,用于人類和人工智能模型共同工作的許多場合,例如社交媒體內容管理、寫作和編程。
"很多時候,人們在沒有任何培訓的情況下就會得到這些人工智能工具,以幫助他們弄清這些工具何時會有幫助。我們在使用幾乎所有其他工具時都不會這樣做--幾乎總是會有一些附帶的教程。但對于人工智能來說,這似乎是缺失的。我們正試圖從方法論和行為學的角度來解決這個問題。"MIT數據、系統與社會研究所(IDSS)社會與工程系統博士項目的研究生、有關這一訓練過程的論文的第一作者侯賽因-莫扎納爾(Hussein Mozannar)說。
研究人員設想,這種入職培訓將成為醫療專業人員培訓的重要組成部分。
"例如,我們可以想象,醫生在人工智能的幫助下做出治療決定時,首先必須進行類似于我們建議的培訓。"資深作者大衛-桑塔格(David Sontag)說:"我們可能需要重新思考從繼續醫學教育到臨床試驗設計方式的一切問題。"他是電子電子工程學教授、麻省理工學院-IBM沃森人工智能實驗室和麻省理工學院賈米爾診所的成員,也是計算機科學與人工智能實驗室(CSAIL)臨床機器學習小組的負責人。
Mozannar 也是臨床機器學習小組的研究員,與他共同完成論文的還有電子工程和計算機科學專業的本科生 Jimin J. Lee、IBM Research 的高級研究科學家 Dennis Wei 以及 MIT-IBM Watson AI 實驗室的研究人員 Prasanna Sattigeri 和 Subhro Das。論文可在 arXiv 預印本服務器上查閱,并將在神經信息處理系統會議上發表。
不斷發展的培訓
現有的人機協作入職培訓方法通常由人類專家針對特定用例制作的培訓材料組成,因此很難推廣。一些相關技術依賴于解釋,即人工智能告訴用戶它對每個決策的信心,但研究表明,解釋很少有幫助,Mozannar 說。
"人工智能模型的能力在不斷發展,因此人類有可能從中受益的用例也在不斷增加。與此同時,用戶對模型的感知也在不斷變化。因此,我們需要一種也能隨時間不斷發展的訓練程序。"他補充道。
為了實現這一目標,他們的上機方法是從數據中自動學習的。它由一個包含許多任務實例的數據集構建而成,例如從模糊的圖像中檢測交通信號燈的存在。
系統的第一步是收集執行這項任務的人類和人工智能的數據。在這種情況下,人類將在人工智能的幫助下嘗試預測模糊圖像中是否包含交通信號燈。
系統會將這些數據點嵌入一個潛在空間,這是一種數據表示方式,其中相似的數據點之間距離較近。它使用一種算法來發現人類與人工智能錯誤合作的空間區域。這些區域捕捉了人類信任人工智能的預測但預測錯誤的情況,反之亦然。
也許當圖像顯示夜間的高速公路時,人類錯誤地相信了人工智能。
發現區域后,第二種算法利用大型語言模型,使用自然語言將每個區域描述為一條規則。算法通過尋找對比示例對規則進行迭代微調。它可以將該區域描述為 "當夜間是高速公路時,忽略人工智能"。
這些規則被用來建立訓練練習。上機系統會向人類展示一個示例,在本例中是一個模糊的夜間高速公路場景,以及人工智能的預測,并詢問用戶圖像中是否有交通信號燈。用戶可以回答 "是"、"否 "或使用人工智能的預測。
如果人類回答錯誤,系統會向他們顯示正確答案以及人類和人工智能在這些任務實例中的性能統計。系統對每個區域都會這樣做,并在訓練過程結束時重復人類出錯的練習。
"Mozannar說:"在這之后,人類就學到了一些關于這些區域的知識,我們希望他們將來能從中學到一些東西,從而做出更準確的預測。
上機操作提高準確性
研究人員對該系統的用戶進行了兩項任務測試--檢測模糊圖像中的紅綠燈和回答多個領域(如生物學、哲學、計算機科學等)的選擇題。
他們首先向用戶展示了一張卡片,上面有人工智能模型的相關信息、訓練方法以及在大類問題上的具體表現。用戶被分成五組:有些人只看了卡片,有些人通過了研究人員的上機程序,有些人通過了基線上機程序,有些人通過了研究人員的上機程序,并得到了關于何時應該或不應該信任人工智能的建議,還有一些人只得到了建議。
只有研究人員的入職程序沒有提供建議,用戶的準確率才有顯著提高,在交通信號燈預測任務中的表現提高了約 5%,而速度卻沒有減慢。然而,在回答問題的任務中,上機操作的效果并不明顯。研究人員認為,這是因為人工智能模型 ChatGPT 在每個答案中都提供了解釋,以表達是否應該信任該答案。
但是,在沒有上機的情況下提供建議卻產生了相反的效果--用戶不僅表現更差,而且花了更多的時間來進行預測。
"當你只給別人提供建議時,他們似乎會感到困惑,不知道該怎么做。這會破壞他們的進程。人們也不喜歡別人告訴他們該做什么,所以這也是一個因素。"Mozannar 說。
他補充說,如果建議是錯誤的,僅僅提供建議可能會對用戶造成傷害。另一方面,入職培訓的最大限制在于可用數據的數量。他說,如果沒有足夠的數據,入職階段就不會那么有效。
未來,他和他的合作者希望開展更大規模的研究,以評估入職培訓的短期和長期效果。他們還希望在入職過程中利用未標記的數據,并找到既能有效減少區域數量又不遺漏重要示例的方法。
IBM 最近獲得了多項新的 SAP 認證——增加了其由 SAP 測試和認證的 100 多個解決方案組合——為客戶提供更多關于在哪里以及如何運行他們的 SAP 工作負載的選擇。這些選擇將允許在 IBM 基礎架構上運行 SAP 工作負載的客戶以優化的、質量受控的方式訪問 SAP 應用程序。新的認證包括:
? IBM Power? Systems Virtual Server,幫助客戶實現 SAP 工作負載的現代化,并可選擇在 IBM 數據中心托管的虛擬化基礎架構中運行這些工作負載。通過此認證,IBM 可以在其虛擬服務器堆棧中運行基于 SAP HANA? 或 SAP NetWeaver? 平臺的應用程序。IBM Power Systems Virtual Server 是一種私有基礎架構即服務 (IaaS) 產品,可以訪問 IBM Cloud 產品的完整目錄。
? 虛擬私有云上的英特爾虛擬服務器,讓客戶可以選擇在 IBM Cloud 上運行的英特爾虛擬服務器上運行 SAP NetWeaver 和 SAP HANA。
CCEP 將使用 IBM 多云管理功能,允許從單個儀表板集成和管理遺留系統以及私有云和公共云,為組織提供統一的視圖和對其整個 IT 基礎架構的一個控制點。
通過選擇擁有數十年行業專業知識和經驗的 IBM 作為其混合云環境,CCEP 正在踏上通往開放和安全云架構的旅程,推動更大的數字化進步。
遷移到云旨在減少 CCEP 的運營費用并提高 IT 彈性。
“最重要的是,通過利用分析和人工智能來改善我們的運營和業務洞察力,遷移到云也將增強我們對客戶的服務,”布里克利說。“我們還有更多工作要做,但該協議是我們發展業務和提高 IT 系統效率的重要里程碑。”
2025-04-09 12:40
2025-04-08 08:51
2025-04-07 12:08
2025-04-07 12:07
2025-04-07 12:06
2025-04-07 09:52
2025-04-07 09:49
2025-04-07 09:43
2025-04-03 09:11
2025-04-03 08:56