导语网络
Offline biases in online platformsapp
——a study of diversity and homophily in Airbnb机器学习
背景ide
共享经济平台是世纪旧现象的新表现。长期以来,跳蚤市场、二手店等一直充当着促进消费者之间未充分利用的商品或服务的资源交换系统。然而,过去小规模和本地协做消费市场如今已成为庞大的在线市场,其中面对面的互动已被新技术所取代。学习
存在的问题spa
分散的、基本上不受监管的在线平台,一般被认为是一个平等竞争的领域,全部参与者都得到相同的机会,共享经济平台最终可能成为线下人类偏见的线上聚合器。3d
事实上,许多研究代表,一些大型共享经济平台正在加速大城市中高档化的现象。例如,Airbnb致使纽约市不一样地区之间出现了短租租金差距(使用airbnb的房产出租的价格相对更高),并加重了洛杉矶的经济适用房危机。反过来,这些现象一般放大了种族之间预先存在的分歧,滋长了Airbnb社区与在Airbnb有重要存在的相邻社区之间的不平等。orm
研究内容blog
01ci
数听说明
数据来自于 InsideAirbnb,包含阿姆斯特丹、芝加哥、都柏林、香港和纳什维尔五个城市2008年-2016年(纳什维尔从2009年开始)的房主、房产与客户信息。
具体的数量以下:
02
研究方法
做者将airbnb的房主与客户模型化为二部图(bi-partite graph)的节点,他们之间用有向边g→h链接,边的权重w为客户在房主那里停留的次数。并根据城市与房型(整租型与共享型)建立了共5*2张二部图。
做者先作一个零假设:客户与房主是随机匹配的。根据这一假设,做者经过对原始网络的边进行重连边来建立一个零假设网络,用这个网络与根据实际经验生成的网络来对比,验证零假设是否成立。
03
研究发现
在性别方面,房主与不一样性别的客户之间的交互差别与城市相关。做者发现,在某些城市(如阿姆斯特丹)同性别之间的交互更加广泛,而另一些城市(如纳什维尔)异性别之间的交互更加广泛。固然这和各个城市airbnb的用户构成也有关系。
在加入住房属性(整租型与共享型)后,做者发现全部城市的整租型房产都趋向于同性别之间的交互,共享型则在不一样城市有不一样表现,在都柏林趋向于异性,在纳什维尔的表现则与零假设相同,没有特别的趋向。
在种族方面,这种差别相比性别来讲没有那么大,但仍有统计学上的显著差别。在全部城市里房主与客户都倾向于同种族,在香港会更加明显。为验证是不是种族背后隐藏的经济水平致使的差别,做者加入了房主与客户的财富属性,仍然获得了上述的结果。
在年龄方面,做者没有获得显著的统计学差别。但airbnb用户的年龄与当地人口结构相比更加的年轻化。
04
总结
做者的研究结果代表,在全部受研究的城市中,某些用户群体(如年轻、白人、女性)与当地人口相比,所占比例大大高于当地人口;此外,在全部城市,不管房产租赁类型如何,都检测到性别和种族的趋同性具备显著性的统计差别。
做者研究的一些局限:
做者数据中的性别、年龄与种族是由房主和客户的照片经过机器学习模型识别出来的,做者经过多种模型交叉验证使研究结果基本可靠;房主与客户之间的联系是由公开的评论获得的,没法获得那些入住后没有评论的交互,和那些被拒绝或者被取消的交易。这些内容有可能影响最后的结果。
- DataCastle -