最近在转录。其实语音转录产品的内部审查和性别偏见非常明显。所有“他妈”两个字无论指代的是确切的“他妈”还是拟声的“他妈”都是转录不出来的。所有“我操”无论指代的是确切的“我操(心)”还是拟声的“我操”也都是转录不出来的。所有的“ta”直接的转录都是“他”,但我有大量的指代其实应该是“她”或者“它”或者“ta”。所有的“出柜”直接转录都是“橱柜”。所有的“酷儿”直接转录都是“库尔”。酷儿语言库在转录中的缺失本身说明了酷儿的不可见。同时默认的“他”也是一种将顺性别男性默认为标准人的性别歧视。其实这些在转录上都并不难实现。如果“它”和“ta”在语言转录上尚且罕见,在转录偏好上一键把“他”全部改成“她”似乎并不是一件难事。这样的话我转录两小时的音频至少节省半小时。
发布于 上海
