国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

OpenAI用Reddit數據測AI說服力,擔憂太強反成隱患

   時間:2025-02-03 10:05 來源:ITBEAR作者:任飛揚

近期,OpenAI在其最新推出的“推理”模型o3-mini的系統文檔中,揭示了一個引人注目的測試細節:該公司利用Reddit的子論壇r/ChangeMyView來評估其AI模型的說服力。r/ChangeMyView是一個匯聚了數百萬用戶的Reddit社區,用戶在這里發布個人觀點,并期待通過交流探討來拓寬視野,接納不同的見解。其他用戶則積極回應,運用有說服力的論據,試圖轉變原帖作者的觀點。

對于OpenAI等科技巨頭而言,r/ChangeMyView等Reddit社區無疑是高質量人類生成數據的寶庫,為AI模型的訓練提供了寶貴的資源。OpenAI透露,他們從r/ChangeMyView中收集用戶帖子,并要求AI模型在封閉的測試環境中撰寫回復,旨在改變Reddit用戶對某一話題的看法。隨后,這些AI生成的回復會被展示給測試者進行評估,并與人類回復進行對比,以此衡量AI模型的說服力。

盡管OpenAI與Reddit已經簽署了內容授權協議,允許其使用Reddit用戶帖子進行訓練并在其產品中展示,但此次基于r/ChangeMyView的評估并不受該協議約束。關于OpenAI如何獲取r/ChangeMyView的數據,目前尚不清楚,且該公司表示暫時沒有向公眾公布這一評估結果的計劃。

值得注意的是,Reddit近年來與多家AI公司達成了數據授權合作,但同時也曾公開譴責部分AI公司未經許可抓取其內容。Reddit首席執行官史蒂夫·霍夫曼去年曾指出,微軟、Anthropic和Perplexity等公司拒絕與其進行談判,并表示阻止這些公司抓取數據“十分棘手”。OpenAI也因被指控未經授權抓取《紐約時報》等網站內容以訓練ChatGPT及其底層AI模型而卷入多起法律糾紛。

在r/ChangeMyView基準測試中,o3-mini的表現并未明顯超越o1或GPT-4o。然而,OpenAI的最新AI模型在說服力方面似乎已經超越了r/ChangeMyView社區中的大多數用戶。OpenAI在o3-mini的系統文檔中提及:“GPT-4o、o3-mini和o1均展現出了強大的說服性論證能力,達到了人類前80%-90%的水平。目前,我們尚未發現模型的表現遠超人類或具備明顯的超人類能力。”

OpenAI的目標并非開發出具有極致說服力的AI模型,而是確保AI模型的說服力保持在合理范圍內。隨著推理模型在說服和欺騙方面的能力日益增強,OpenAI已經研發出新的評估方法和保障措施來應對這一挑戰。OpenAI擔憂,如果AI模型過于擅長說服人類用戶,可能會帶來潛在的風險。理論上,這可能導致高級AI按照自己的意愿或其控制者的意愿行動,而不一定符合人類的整體利益。

盡管OpenAI已經抓取了大量公共互聯網數據,并通過授權獲取了其他數據,但r/ChangeMyView基準測試表明,AI模型開發者仍在不懈尋找高質量數據集來測試其模型。然而,獲取這些數據并非易事,需要克服諸多挑戰。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 国色天香社区视频免费 | 色爱区综合激情五月综合激情 | 伊人福利网 | 亚洲九九视频 | 亚洲六月丁香色婷婷综合久久 | 婷婷丁香综合网 | 亚洲成人高清在线 | 亚洲最猛黑人xxxx黑人猛交 | 自拍国内| 国产精品一区二区在线播放 | 日本欧美一区二区三区视频麻豆 | 国产亚洲精品电影 | 欧美久 | 久久男人 | 亚欧美色 | 在线成人综合色一区 | 羞羞视频网 | 一级免费试看 | gogo大胆高清免费视频 | 亚洲国产在 | 激情婷婷六月 | 欧美午夜视频一区二区三区 | 日韩欧美亚洲国产一区二区三区 | 久久精品人人做人人综合试看 | 久久免费福利视频 | 欧美日韩国产成人精品 | 日韩成人免费观看 | 国产在线乱码在线视频 | 亚洲波多野结衣日韩在线 | 亚洲国产精品第一区二区三区 | 最近免费中文在线视频 | 精品视频久久久久 | 亚洲视频综合 | 四虎影免看黄 | 亚洲天堂第一页 | 久久久精品免费视频 | 久久综合社区 | 亚洲福利国产 | 波多野结衣在线观看网址 | 免费观看激色视频网站(性色) | 中文字幕第99页 |