历史
一人之下 > 看不见的女性 > 第8章 适合所有人的尺寸

第8章 适合所有人的尺寸(6 / 8)

了20世纪晚期大量文本中的1亿个单词),发现女性代词的出现率始终只有男性代词的一半左右。[35]尽管当代美国英语语料库有5.2亿个词,收录了近至2015年的文本,但男女代词的比例也是2比1。[36]依据这些满是缺口的语料库来训练的算法,就给人留下这样一种印象:这个世界实际上是由男性主宰的。

图像数据集看来也存在性别数据缺口的问题:2017年,一项对两组常用数据集的分析发现,男性图像的数量远超女性图像;这两组数据集包含“来自网络的10万多张复杂场景的图像,并附有说明”。[37]华盛顿大学的一项类似研究发现,在他们所测试的45种职业中,女性在谷歌图像搜索中出现的比例偏低,其中CEO的比例最为悬殊:美国27%的CEO是女性,但在谷歌图像的搜索结果中,女性只占11%。[38]搜索“作家”的结果也是不平衡的,谷歌图片中只有25%的搜索结果是女性,相比之下,美国作家中女性的实际占比有56%,研究还发现,至少在短期内,这种差异确实影响了人们对某个领域性别比例的看法。当然,对于算法来说,影响会更长远。

这些数据集不仅未能充分代表女性,而且歪曲了她们的形象。2017年一项对常用文本语料库的分析发现,女性的名字和相关用词(“妇女”“女孩”等)与家庭的关系大于与职业的关系,而男性的情况正好相反。[39]2016年,一项基于谷歌新闻的流行公共数据集分析发现,与女性相关的最热门职业是“家庭主妇”,与男性相关的最热门职业是“名家大师”。[40]与性别相关的十大职业还包括:哲学家、社交名人、队长、前台接待员、建筑师和保姆——你可以自行猜测,哪些是男性,哪些是女性。2017年的图像数据集分析还发现,图像中包含的活动和物体表现出“明显的”性别偏见。[41]研究人员之一马克·亚茨卡尔预见了这样一种未来:如果机器人是通过这些数据集来训练的,当它不确定人们正在厨房里做什么的时候,它就会“给一个男人一杯啤酒,让一个女人帮忙洗碗”。[42]

这些文化成见可从现已广泛使用的人工智能技术中找到。例如,斯坦福大学的教授隆达·席宾格想把报纸对她的采访从西班牙语译成英语,而谷歌翻译和Systran翻译系统都反复使用男性代词指代她,尽管文中出现了像profesora(女教授)这类明显指代女性的术语。[43]谷歌翻译还在将土耳其语译成英语

排行阅读

神父在回家路上被推销了一只混血恶魔,很便宜,所以他买了。空虚神父攻X倒霉恶魔受
我深深地爱着你,你却爱着一个傻逼,傻逼他不爱你,你比傻逼还傻逼,爱着爱着傻逼的你,我比你更傻逼,简单来说,本文讲述一个,谁比谁更傻逼的故事。

苍白爱情

三秋泓
天之骄子渣攻X自卑怯懦美人伪骨科年下宋知雨寄人篱下,为了苟活,主动变成了继弟严越明最喜欢的床上玩具。注意:没有排雷,到处是雷。自带扫雷系统,谢谢。

大符篆师

小刀锋利
执笔绘天地,以法镇苍穹——小白同学的大符篆师之路。

万族之劫

老鹰吃小鸡
万族之劫男主角是苏宇,原大夏府南元城南元中等学府学生,以上上等的高评价、并以南元第一的成绩考入大夏文明学府并拜师白枫,加入多神文系,脑海中开启神秘书册。我是这诸天万族的劫!万族之劫小说什么时候更新?

那月光和你

语笑阑珊
大学毕业,顾扬进了一家购物中心当实习生。三年后,他作为公司管理层,和总裁陆江寒一起出席新店发布会。一切看起来都是顺风顺水,风波却悄然而至。高层公寓里,陆江寒一点点裁开被胶带缠住的硬皮笔记本,轻轻放回顾扬手里。那是被封存的梦想,也是绮丽华美的未来。再后来。“陆总,您能客观评价一下顾先生吗?”“对不起,他是我爱人,我客观不了。”
最新小说: 和大佬上恋综后万人嫌爆红了 她厌男,她是我女友 当我们不再理解世界 斑马 我靠读心NPC苟命[无限] 什么是历史社会学 如雪如山 我本芬芳 她对此感到厌烦 冷美人教练喜欢乖的[电竞]