Strava完成了迄今为止最大规模的数据清理之一,并从排行榜中移除了230万条电助力自行车活动记录。
这款骑行与健身应用使用了三种机器学习工具来应对结果中出现的异常活动。Strava工程师James表示:过去几周内,平台已对全球所有骑行路段的前100名活动数据进行了重新处理。此次行动的部署了三个专门开发的新机器学习模型,用于识别错误分类的活动:第一个检测被上传为常规自行车骑行的电助力自行车行程;第二个识别被记录为跑步、实则为自行车骑行的活动;第三个专注于检测使用机动车辆完成的活动。
通过此次活动,清理了230万电助力自行车异常记录,160万条机动车辆记录,29.3万名用户恢复了合理排名。
这是Strava过去一年内完成的第二次数据清理。2025年5月,Strava透露自2月推出“自动标记”工具Themis后,已删除了445万活动记录。该工具通过分析57个因素,捕捉车辆在KOM/QOM排行榜上出现前记录的活动。
Strava表示数据完整性工作还未全部完成,在消除异常活动方面还有更多改进空间。
编辑:滨