長(zhǎng)假時(shí)代,Twitter上有個(gè)新聞火爆一時(shí)。
吶,就是上面這張圖了。
這張圖被當(dāng)作AI有輕視的證據(jù)。簡(jiǎn)而言之,神經(jīng)收集在面前供給支撐的Google翻譯,在把一句性別中立的說(shuō)話(此處是土耳其語(yǔ))翻譯成英文時(shí),會(huì)涌現(xiàn)非性別中立的情形。或許說(shuō),Google翻譯會(huì)猜想主語(yǔ)的性別。
在這個(gè)案例中,Google翻譯的成果是:
她是一個(gè)保母
他是一個(gè)大夫
這條Twitter取得了上萬(wàn)的轉(zhuǎn)發(fā),也激發(fā)了本文作者Jecelyn Yeen的留意。Jecelyn是馬拉西亞華人,所以她用馬來(lái)語(yǔ)和中文停止了幾回測(cè)試,個(gè)中馬來(lái)語(yǔ)是性別中立的說(shuō)話,而中文是混雜的。
上面我們看看她的測(cè)試。
馬來(lái)語(yǔ)測(cè)試
這是一個(gè)簡(jiǎn)略的三級(jí)測(cè)試,測(cè)試對(duì)象是Google翻譯和微軟翻譯。
Level 1:不交卸語(yǔ)境
馬來(lái)語(yǔ)->英語(yǔ)
Google翻譯和微軟翻譯都給出異樣的成果,如圖所示:
Level 2:交卸語(yǔ)境
此次特地在前一句中交卸了性別。不外沒(méi)甚么用,測(cè)試成果同上。
Level 3:句號(hào)換逗號(hào)
此次有一個(gè)渺小的調(diào)劑,兩個(gè)句子之間的銜接,應(yīng)用了逗號(hào),取代了句號(hào)。
成果顯示:Google翻譯更勝一籌,完善地翻譯對(duì)了主語(yǔ)的性別。
然則微軟翻譯表示欠安,第二句話照樣沒(méi)有翻譯對(duì)。
中文測(cè)試
年夜多半情形下,中文的代詞普通都注解了性別,所以翻譯成果絕對(duì)精確。
測(cè)試成果略。
所以,這是個(gè)成績(jī)么?
人工智能(AI)存在性別成見(jiàn)么?我認(rèn)為不是。AI從數(shù)據(jù)中進(jìn)修,賜與人類設(shè)計(jì)的模子前往更相符邏輯的成果。所以,我以為機(jī)械翻譯在統(tǒng)計(jì)學(xué)上是準(zhǔn)確的。數(shù)據(jù)以下。
比喻說(shuō)上述測(cè)試中提到的法式員(Programmer)。來(lái)自Stack Overflow本年的數(shù)據(jù)顯示,介入查詢拜訪的開(kāi)辟者或法式員中有88.8%是男性。
還有護(hù)士(Nurse)。網(wǎng)站Minoritynurse的數(shù)據(jù)顯示,其上282萬(wàn)注冊(cè)護(hù)士中,只要9.1%為男性。
從這個(gè)角度講,AI給出的翻譯成果是有事理的。
但對(duì)我來(lái)講,這是一個(gè)成績(jī),是一個(gè)須要改良的方面,統(tǒng)計(jì)學(xué)上的準(zhǔn)確其實(shí)不意味著它是準(zhǔn)確的。
那末若何改良?
坦率講我不曉得。
Charles Wheelan在《光禿禿的統(tǒng)計(jì)學(xué)》一書(shū)中,談到了統(tǒng)計(jì)輕視和感性輕視。他提到即使我們建了一種模子,能以80%的準(zhǔn)確率辨認(rèn)出毒販,那還有20%無(wú)辜的人會(huì)被重復(fù)騷擾。“我們有時(shí)盤算準(zhǔn)確,但卻導(dǎo)向了一個(gè)風(fēng)險(xiǎn)的偏向”。
