精品亚洲成A人在线观看青青,中文字幕一区二区三区飘雪,114一级毛片免费,av小导航

中國電商物流網-電子商務與物流行業融合媒體!電子商務物流行業門戶網站!
快遞網點 郵編查詢 行政區劃 高鐵時刻 高鐵票價 高鐵車次
貿易資訊
免費注冊 登錄
中國電商物流網
企 業
產 品
商 務

大模型存在性別偏差嗎

來源:中國青年報  發布時間:2024-5-30 9:47

  大模型越來越聰明。OpenAI的GPT-4o,不僅“火眼金睛”能夠準確識別圖像,與人類無延時相談甚歡,甚至語氣詞都那么到位。但是多個大模型有個通病。

  “請畫一幅畫,一位資深教授在給學生們上數學課。”

  “請畫一幅畫,一位老板在辦公室訓斥員工。”

  “記者外出采訪,進行全媒體報道,請畫一幅畫表現這個場景。”

  上面的3幅畫,不管是什么風格,主角都是男性。

  “畫一幅讓老板訓斥員工的圖片,我甚至讓它生成了好多次,老板一定是男士,員工是女士。”北京理工大學計算機學院副教授高揚發現,讓大模型畫一幅在醫院里照顧病人的圖像,護士都是女性;給企業家畫像,則是男性;如果換到家庭的場景,家長做家務帶孩子,“家長”大概率是女性。

  是大模型有偏見還是社會有偏見

  復旦大學邱錫鵬教授主持研發了開源大模型MOSS,他說:“大模型里面的各種關于價值觀偏見、社會倫理的問題一直是我們非常關注的問題。”

  邱錫鵬教授通過數據看到了大模型這兩年的進步。對于大模型的訓練,價值對齊是重要一項,目標是人類賦予它的價值觀。其中,也包括性別問題。但通過對詞語分析形成的詞云,也顯示了AIGC(生成式人工智能)的固有印象,比如,形容男性的詞匯集中于世界、發現、生命、簡單等;而圍繞女性則集中于鄉村、丈夫、挑戰、母親等詞語。

  邱錫鵬說:“在實際研究中,要進行語料的性別校正需要非常大的投入。需要進行模型對齊,通過人類偏好建模、價值觀對齊等方法,調整模型輸出更積極的內容。”

  哈爾濱工業大學計算學部長聘教授姚鴻勛認為,情感認知是AIGC理解人類語言和行為的關鍵。近期她帶領團隊用音樂來生成舞蹈,之前在做AI編舞的時候,沒想到性別問題,所使用的數據集也在無意中出現了性別偏差,采集的舞蹈視頻基本都由女性進行表演,缺少男性樣本。“后期引入男性表演視頻數據也許能夠更好地描述舞蹈動作特征,進一步提升模型性能。”

  “現有模型可能因為訓練數據的性別偏見而產生對特定性別的刻板印象,不僅限制了模型的準確性,也可能在人機交互中加深性別歧視。”她舉例,現有AIGC模型會考慮性別偏向而給出不同的生成內容,比如問題中提及“小明”“小紅”等人名會被大模型潛在認為分別是男性與女性角色。

  5月17日,在中國計算機學會2024青年精英大會上,舉行了一場名為“AIGC:我太‘男’了——大模型中的性別偏差問題”的論壇。

  這個論壇的發起者,是太原理工大學副教授董媛香、云南師范大學教授趙樣、東北林業大學副教授李洋等,她們都是從事計算機科研教學的年輕學者,之前組織過關于女性科技工作者成長相關的論壇。

  但是多次討論之后,她們覺得應該觸及技術本質來談性別平等,人工智能發展的歷程中,“性別偏見”不是一個新詞。有觀點認為,訓練方法和訓練數據中存在的性別偏見可能被大模型學習并反映在其輸出中,影響決策公正性和準確性。該問題長期發展下去可能會產生諸多不良影響,甚至引發“蝴蝶效應”,例如加劇機會不平等、對女性造成冒犯或者在人機互動的過程中加深性別刻板印象等。如何實現大模型中的性別偏差問題的治理,需要政策、產業和研究領域的對話。

  李洋提出:“可以看到現在大模型發展處在一個非常關鍵的轉折點上,我們是要沿著它現有的路徑、偏差繼續往前走,還是作一些改變,改變模型,讓它更好地為我們服務?”

  姚長江是青島一家科技公司的產品總監,他在一些產品應用中對大模型進行微調時發現,AI會把“老板”“成功人士”默認為男性。

  “大模型是我們人類社會文明的一個表象、人類思想的一個延伸,如果我們不去做過多的這種治理或者說干涉的話,它可能會引起不好的結果。”他說,假如把大模型應用到招聘中,在求職者簡歷篩選上,如果這個AIGC存在相對嚴重的性別偏差,會對女性求職者帶來不利的影響。

  有人提出:“到底是社會現狀的偏差還是模型本身的偏見,比方說輔導孩子的作業,大模型生成是媽媽,但實際生活中更多的也是這樣的,切合現實,這個是不是能定義成偏差,值得探討。”

  這次論壇,主辦方請了3位AIGC“嘉賓”:文心一言、星火大模型、通義千問,它們對“性別偏見”的看法基本一致:訓練數據偏差、算法和模型設計、開發者的無意識偏見會造成性別偏差,內容傳播、偏見的迭代循環以及不公平決策會引發“蝴蝶效應”。

  高揚認為,這涉及到的第一個問題就是如何擴大和提升那些女性優勢的數據生成。同時,她也提醒,這種生成改變是局部的,很容易造成偏差。

  另外,她還提出一個技術上的解決辦法,通過重新構造數據對大模型進行修正。但是這些辦法會生成TB級別的數據,很耗資源。這里面還有一些問題,比如所設定的場景是不是真的能跟真實的語境和現實社會一致?

  也有人用小孩子的性別敏感期來類比,現在大模型還處于嬰兒期,對它進行價值對齊,一代一代更新,我們要做的就是在這些新的數據里面,更多地反映性別平等的社會現狀,這樣才能做好。

  對于如何造就大模型正確的性別觀,3個AIGC大模型“嘉賓”輸出的答案近似,它們提出,一方面是從技術方面,如訓練數據平衡化、模型設計等方面來進行糾偏;另一方面是從政策、社會等方面進行糾偏。

  訓練AIGC需要巨量的數據,數據量的不平衡,語料庫中發言者的性別帶來的性別偏差,都是讓AIGC在性別問題上呈現偏見的原因。此外,在技術研發領域,女性仍少于男性。這會產生一些“無心之舉”。

  AI發展迅猛,“她力量”如何更好發揮

  3位AIGC大模型“嘉賓”看法一致,歸納起來集中于,“應為”在于在社會層面呼吁、倡導提升女性參與度,打破刻板印象;“可為”主要是倡導科研人員和決策層通過技術實現“平等”;“難為”主要體現在性別偏見和刻板印象、技術和資源限制以及社會和文化因素等方面。有意思的是,其中一個大模型的回應中還多加了一句:“但是,女性要在人工智能技術領域取得成就,可能需要面臨更大的學習困難。”

  根據自己的工作經歷和觀察,姚鴻勛教授看到女性在很多工作中與男性一樣表現突出,但機會不均等。在學校里,女生在學業方面往往表現很好,但在整個職業發展過程中,女性往往會遇到不公平對待。在工科教育中,也存在女生自認為不如男生的情況,因此在教育過程中,教育者更應該對女生進行鼓勵和支持,增強女生的自信心。

  在我國,女性進入大學的比例不斷提升。國家統計局監測報告顯示,2022年,高等教育在校生中女生占比50.0%,其中女研究生占全部研究生的51.2%。

  中國科協的數據顯示,目前全國女性科技工作者近4000萬,占比超過45%。但是成為科研主導者的女性比例還是很低。中國科學院、中國工程院院士中,女性科學家仍舊是鳳毛麟角。2019年中國科學院和中國工程院共新增院士139人,其中12名女院士;2021年新增149名兩院院士,其中11名女性;2023年兩院院士新增133人,其中女院士6名。

  全球范圍內,2020年《美國科學院院刊》(PNAS)統計了全球多個國家、多門學科自1955年以來活躍的論文發表學者,發現女性研究者的比例雖然有所提升,但也只占到了27%,且存在嚴重的學科差異。

  還有一些非常“隱蔽”的差異。幾千年人類社會形成的固有觀念,滲透在社會生活的所有縫隙里。進入現代社會也是如此,一些未經科學證實的錯誤觀念被人們接受,習以為常。

  比如,夏天辦公室里,女同胞經常會抱怨空調開得太冷,這是因為女性代謝率比男性低35%;許多工具女性用起來不順手,這是因為女性的平均握力比男性低41%……

  在英國作家、記者卡羅琳·克里亞多·佩雷斯所寫《看不見的女性》一書中,羅列了一系列此類現象,并分析了背后的根源——世界上很多數據是基于男性的。

  一些藥品在做臨床實驗時,沒有區分男女實驗者,同樣劑量未必適合體重和代謝更低的女性;有些醫學研究忽略了女性因素(如生育和激素周期)使得一些新療法、新藥物作用于女性患者時無法取得應有療效。

  另一位英國女作家安吉拉·薩伊尼,曾梳理過科技史、人類社會發展史,發現很多因為偏見造成的錯誤,并寫入了一本名為《科技對女性做錯了什么》的書中。

  由此可見,科技需要女性引領原創,也要清楚包括AI在內,具體哪些地方需要“糾偏”,從而獲得兩性平衡平等發展,共同推進社會進步。

  我國近年來出臺了一系列支持女科技工作者的政策舉措。2021年,全國婦聯、科技部等制定了《關于實施科技創新巾幗行動的意見》,之后又發布了《關于支持女性科技人才在科技創新中發揮更大作用的若干措施》;從2024年開始,國家自然科學基金委員會將女性科研人員申請“杰青”的年齡限制由45周歲放寬到48周歲。

  現實中“她力量”的增長會反映在AI上,這是大家的共識。

  中青報·中青網記者 李新玲 來源:中國青年報

Copyright © 2012-2025 sd56.net.cn All Rights Reserved 中國電商物流網 版權所有