AI沒有偏見?它們從人類的語言中學會了性別和種族歧視

    新消費
    2017
    04/14
    15:33
    量子位
    分享
    評論

    AI沒有偏見?它們從人類的語言中學會了性別和種族歧視

    在性別和種族問題上,人工智能能夠消除人類的偏見嗎?

    《科學》上發表的一項最新研究給我們潑了一盆冷水。普林斯頓大學信息技術政策中心計算機科學家Arvind Narayanan和他的同事們發現,機器學習算法會輕易模仿其訓練數據集中隱含的偏見。

    他們從網上用爬蟲收集了220萬詞的英語文本,用來訓練一個機器學習系統。結果,系統也會展示出了與這些文本相同的偏見。

    在較為中性的例子中,人工智能系統更有可能將“花朵”和“音樂”與“愉快”聯系起來,而“昆蟲”或“武器”等不太愉快的詞不太可能建立這種聯系。但人工智能也也更有可能將歐洲裔美國人的名字與“快樂”聯系起來,非洲裔美國人的概率較低。同樣地,這種算法往往會將“婦女”和“女孩”與藝術關聯,而不會與數學關聯。

    “在機器學習執行的所有感知任務中,都應該擔心它是否會體現人類的偏見。”Narayanan說,“這可能會進一步創造一種反饋回路,延續這些偏見。”

    為了展示自然語言學習所能引發的偏見,Narayanan和他的同事根據心理學家揭示人類偏見時使用的內隱聯想測驗(IAT),創造了新的統計學測驗。他們的成果發表在2017年4月14日出版的《科學》雜志上,這也是首份展示“文字嵌入”(word embedding)中體現的人類偏見的科研成果。

    所謂“文字嵌入”,其實是一種普遍應用于機器學習和自然語言處理過程的統計建模技術。文字嵌入需要了解一個人的語言在空間上的不同點,并通過重現幾何關系的方式來分析這些點之間的語義關系。

    猶他大學計算機科學家Suresh Venkatasubramanian表示,人工智能從訓練數據集中學會了偏見或許算不上令人震驚的發現,但這項研究駁斥了之前的一個論調:人工智能天生比人類更加客觀。

    由于人工智能在硅谷和世界各地的科技巨頭中十分流行,所以這項結果意義重大。

    要理解潛在的影響,可能需要閱讀一下普利策獎獲獎文章《機器偏見》(Machine Bias),這個系列的文章展示了原本用來預測潛在犯罪分子的電腦程序是如何對黑形成偏見的。有鑒于此,一些研究人員考慮在部署機器學習算法的過程中,識別并減輕人類偏見所產生的負面影響。

    “訓練流程和訓練數據的好壞決定了最終的算法。”Venkatasubramanian說,“它們不會生來就自動獲得客觀立場。”

    哈弗福特學院計算機科學家Sorelle Friedler表示,這項新的研究邁出了重要的一步,揭示出各種機器學習中可能存在的語言偏見。作為機器學習公平、負責、透明小組的組織者,Friedler指出,過去的研究主要調查了已經使用的特定機器學習算法的偏見。

    “我很喜歡這項研究,因為他們沒有試圖調查單一的‘活躍’系統,而是分析了很多活躍系統的一塊基石。”他說。

    Narayanan和他在普林斯頓大學及英國巴斯大學的同事首先采用了文字嵌入聯想測驗(WEAT),以此復制以往的心理學研究中的種族和性別歧視例子。但他們還開發了文字嵌入事實聯想測驗(WEFAT),不僅僅局限于文字聯想。第二項測試顯示,機器學習語言聯想的統計學強度,與女性2015年在50種不同工作中占據的比例相關性極強。

    就連研究人員都對語言使用和美國勞工部統計數據之間的強相關性感到意外。“完全根據語言使用來看,考慮職業與性別詞匯的使用關系,我們發現女性在任何一個職位上的相關性都達到90%。”Narayanan說。

    針對這項新研究開發的統計測試,不僅暴露了機器學習領域的潛在偏見問題,還可以成為一項有用的工具,用來分析特定社會偏見在文字發展史上的演變過程。正如研究人員證明的那樣,這些測試也有助于心理學實驗室測試所揭露的偏見與現實世界的實際影響之間的相關性。(Narayanan將此歸功于他的同事多樣化的學術背景,該團隊包括機器學習專家Aylin Caliskan和認知科學家Joanna Bryson。)

    使用機器學習技術——尤其是深度學習技術——的科技巨頭和創業公司,都應該盡快克服其人工智能系統的潛在偏見。Friedler解釋道,人們現在逐步意識到這個問題,并且開始展開針對性的討論,但尚未就如何處理偏見達成系統性的一致意見。

    可以考慮從數據集中去掉偏見因素,但可能因此失去一些有用的語言和文化意義。人們需要作出艱難的道德抉擇,尋找具體的偏見和應對策略,避免這些偏見對日漸強大、越發普及的人工智能系統產生負面影響。

    “我們需要判斷哪些偏見在語言上有用,哪些會產生社會問題。”Friedler說,“如果我們認為存在社會問題,就應該有意識地移除這些信息。”

    來源:量子位

    THE END
    廣告、內容合作請點擊這里 尋求合作
    ai
    免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

    相關熱點

    急性腎損傷(AKI)是指腎臟突然不能過濾血液中的廢物,這種疾病會直接破壞重癥病人的腎臟系統。
    業界
    榮耀總裁趙明在世界互聯網大會物聯網分論壇,發表了題為《物聯網:消費革命的黃金十年》的演講中指出,全球將迎來IoT爆發性增長期,企業對物聯網將迎來消費革命的“黃金十年”。
    業界
    11月5日,搜狗公布了未經審計的2018年第三季度財報。財報顯示,截至9月30日,搜狗總收入超18.8億元,同比增長10%,非美國通用會計準則凈利潤1.9億元,整體業務發展穩健。
    業界
    盡管AI影響范圍如此之廣,但仍然還只是亞馬遜、谷歌等大體量企業的“玩具”以及部分創業公司的顯著標簽。對于絕大多數企業來說,AI 的成本高、全面部署困難等特性依然為它的落地帶來不小的困擾。
    滾動
    銀河水滴創始人兼CEO黃永禎同時宣布,銀河水滴工業視覺平臺“IndustryAI”的工業視覺檢測算法將面向工業用戶三年免費開放。
    業界

    相關推薦

    1
    3
    主站蜘蛛池模板: 精品日本一区二区三区在线观看| 台湾无码一区二区| 无码日韩人妻AV一区二区三区| 偷拍精品视频一区二区三区| 国语精品一区二区三区| 国产人妖视频一区二区破除| 国产天堂一区二区综合| 一区一区三区产品乱码| 亚洲国产综合无码一区| 无码人妻精一区二区三区| 一区二区在线免费观看| 午夜无码视频一区二区三区| 日本片免费观看一区二区| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 亚洲毛片不卡av在线播放一区| 久久久国产精品一区二区18禁| 精品久久久中文字幕一区| 波多野结衣一区二区| 国产电影一区二区| 亚洲日韩中文字幕无码一区| 在线观看国产一区二三区| 色偷偷一区二区无码视频| 在线播放一区二区| 男人的天堂av亚洲一区2区 | 日韩国产精品无码一区二区三区| 国产成人一区二区精品非洲 | 69久久精品无码一区二区| 在线欧美精品一区二区三区| 日本片免费观看一区二区| 中文字幕精品一区二区| 色综合一区二区三区| 无码人妻精品一区二区在线视频| 精品视频在线观看你懂的一区 | 午夜福利av无码一区二区| 色噜噜狠狠一区二区三区果冻| 日韩一区二区在线视频| 亚洲国产一区视频| 亚洲丰满熟女一区二区哦| 人妻无码一区二区视频| 亚洲av无码一区二区三区观看 | 国产一区二区好的精华液|