人工智能在过去几年里取得了长足的进步,电商根据人们的消费习惯进行购买预测,搜索引擎根据输入法进行输入辅助,社交媒体平台帮助我们整理和标记我们的照片,以便于搜索。现在人工智能开始走向金融领域。
世界银行发展数据组的ICP团队利用英特尔的BigDL框架(Apache Spark *的分布式深度学习库)和运行在英特尔®至强®处理器上的AWS Databricks *平台,帮助整理超过100万众包照片进行分类与公众共享数据集。
ICP试点研究
这些照片是ICP在2015年12月至2016年8月进行的试点数据收集研究的一部分。在这个项目中,付费贡献者使用智能手机为15个国家(从食品到鞋类的162个类别)收集了各种家居用品和服务的照片和价格相关数据。这些国家包括阿根廷、孟加拉国、巴西、柬埔寨、哥伦比亚、加纳、印度尼西亚、肯尼亚、马拉维、尼日利亚、秘鲁、菲律宾、南非、委内瑞拉和越南。
为了有效地比较所有这些国家内部和国家之间的照片,ICP团队转向了人工智能和深度学习模型,这些模型可以帮助审查、搜索并将这些图片分类为162个类别。简而言之,他们需要AI自动确认众包照片是否与提交观察结果的商品和服务相匹配,并从沿途的照片中删除个人识别信息(PII)。
这只是英特尔BigDL平台的众多案例之一,该平台支持人工智能和深度学习应用,开发者可以加入以解决人工智能领域面临的挑战。