Instagram:大数据与人工智能让社交软件更智能
2010年推出的Instagram是一款分享照片和视频的社交应用。如今,Instagram拥有8亿月活跃用户,并且归Facebook拥有。每天有7000万张照片上传到Instagram,人们通过这些照片和文字进行互动,评论和使用标签,用心表达情感。所有这些都会创造大量的数据。这些数据经过分析--并且越来越多地通过 人工智能 算法进行分析--可以为人类行为提供令人难以置信的商业智能和洞察,因此Instagram首席执行官Kevin Systrom说:"我们也将成为一家大数据公司。"
下面就让我们来看看Instagram是如何使用大数据和人工智能的。
探索页面和搜索功能
通过使用标签和趋势信息,Instagram用户可以找到特定活动、主题或事件的照片,或者发现世界各地的各种体验、餐馆和地点。搜索工具可使用标签,帮助Instagram用户在数百万上传的图像中发现他们感兴趣的内容。
目标广告
为了让Instagram收集的数据具有价值,就必须从中提取出客户洞察。通过评估用户的搜索偏好和参与度分析,Instagram可以向那些想要得到特定客户资料、了解哪些客户可能对接收特定营销信息最感兴趣的企业销售广告。Instagram的母公司Facebook拥有18亿用户,因此他们具有强大的分析信息网络,可根据人们喜欢的内容、他们关注的人以及与之互动并保存的内容来推送定位广告。
增强用户体验
为了确保用户在平台上找到有价值的信息,Instagram向他们展示他们喜欢的内容,就变得很重要。随着内容不断增加,查找与每个用户相关的内容就变得越来越有挑战性。当Instagram将反馈按时间顺序显示,改为显示他们认为用户可能喜欢和愿意分享的帖子时,就可以使用机器学习算法,来帮助对信息进行分类,并随着时间的推移,更好地了解每个用户最重要、最相关的内容是什么,从而创建个性化的信息流。
过滤垃圾邮件
Instagram使用人工智能来对付垃圾邮件。垃圾邮件过滤器能够从包括英文、中文、俄文、阿拉伯文等9种语言帐号中删除伪造的邮件。一旦检测到消息,就会被自动删除。 Instagram使用Facebook的DeepText人工智能算法,这种算法在理解消息上下文方面的表现几乎可以媲美人类。
打击网络欺凌和删除攻击性评论
在由Ditch the Label进行的一项调查中,有超过1万名12至25岁的英国青年中,有42%的人表示Instagram是他们最受欺凌的平台。因为被视为网络欺凌问题最严重的社交媒体网站,Instagram因此成为第一个使用机器学习自动删除攻击性帖子的公司,而Facebook和Twitter主要依靠用户报告有滥用语言的情况。基于使用DeepText识别垃圾邮件并将其删除方面所取得的成功,Instagram开始将其视为识别和消除违反Instagram社区准则评论的一种解决方案。人类员工会检查并标记实际的Instagram帖子,帮助DeepText了解在某些情况下被视为冒犯性的内容,以及不属于冒犯性的内容。如果算法发现某些令人反感的内容,就会立即删除。
尽管DeepText并不完美,但这一算法已经得到网络预防组织对其发挥作用的赞誉。目前还存在误将某些并非冒犯性评论错误分类为冒犯性内容的风险。
研究人类
在一项研究中,有1亿张Instagram照片被用来训练全球服装模式。由于机器学习的原因,有海量的数据需要经过审查。这项研究表明,机器学习在研究人类以及世界各地的社会、经济和文化因素并提取见解方面能起到一定的帮助作用。这项研究展示了大数据以及计算机视觉、自动分析算法和机器学习等技术在处理由社交媒体网站生成的庞大数据集、了解我们周围世界方面具有的强大能力。
从增强用于用户和广告的平台,到查找和删除虚假或冒犯性内容,Instagram利用从所有数据中心提取的信息来改善自我,同时也有其他一些公司在Instagram收集的大量数据中发现了具有巨大潜力,可以用来揭示人类行为、文化等等。
下一篇: Pandas 基本数据结构