乂学教育-松鼠AI参加2019人工智能与大数据伦敦世博会
当地时间4月25日至26日,全球人工智能与大数据博览会于伦敦奥林匹亚举行。这是一个展示来自人工智能和大数据领域下一代技术和战略的博览会,为期两天,吸引了(超过)4000名相关从业者。
此次的人工智能与大数据大会主题包括:企业人工智能、人工智能与物联网数据分析、大数据业务解决方案、人工智能技术解决方案。
乂学教育-松鼠ai联合创始人、首席科学家崔炜博士应邀在博览会上发表演讲致辞,与来自英国网络安全公司darktrace、世界第三大独立软件供应商sap、美国最大社交平台之一的reddit、丹麦“美团”just-eat等公司的高管共同分享在ai领域的真知灼见。
松鼠ai崔炜:人工智能如何为中国每个家庭提供经济实惠的个性化教育
松鼠ai首席科学家崔炜博士介绍了松鼠ai自主研发的人工智能自适应在线学习系统,能不断地监测和评估学生个体的能力,发现他们学习中的弱点与不足,并让学生按照自己的步伐进步,提高学习成果。该系统提供优化的学习解决方案和同步的辅导支持,最大限度地提高学习效率,并提高学生的知识、技能和能力。
多年来,中国教育存在的高级教师资源短缺和地缘问题都影响优质教育的普及。松鼠ai的愿景是通过人工智能打造超级教师,给成千上万的学生提供一对一量身教学。
在本次演讲中,崔炜介绍了用于构建系统和性能评估实验的基本技术。松鼠ai智适应教育引擎包含三层架构:本体层、算法层、交互系统。本体层以内容为主,包括学习地图、知识地图。松鼠ai自主研发了超纳米级的知识点拆分,可以对学生知识点更精准地判断。以初中数学为例,松鼠ai可以将3500个知识点细化为3万个。
算法层包含内容推荐引擎、学生用户画像引擎、目标管理引擎等。松鼠ai会结合用户状态评估引擎和知识推荐引擎,构建出数据模型,精准高效地测出每个学生的知识漏洞,根据学生的知识漏洞推荐相应的学习内容。
交互系统通过采集交互数据了解更多学生的信息,完善算法。松鼠ai和斯坦福研究院合作,研究机器和学生的交互系统,其自主研发的miba学生行为数据采集系统在世界人工智能大会获得了大奖。
除此之外,松鼠ai自研的mcm系统,能够将学习的思想、能力、方法进行拆分,根据学生状况提供单一学科里思想能力的训练。
截至到今年年初,松鼠ai已经全国300多个城市开设近2000家学习中心超过1800家线下学校,累计注册学生用户近200万。学生超过100万,付费学生近10万,二次续费率80%。去年,松鼠ai开始捐赠了100万个免费学习账号,给到数百万特贫困家庭的孩子,来促进教育的公平化。
sap全球副总裁marc teerlink:如何利用人工智能时代“淘金”
sap全球副总裁marc teerlink谈到了企业如何适应人工智能时代。世界正处于人工智能淘金热的边缘,teerlink的演讲有关人工智能和机器学习如何为企业带来财富,以及目前行业领头羊的经验分享。
据sap估计,到了2030年,超过6成的工作将会面临巨大的改变。大约51%的工作活动将会被自动化,但是只有5%的工作会被机器完全取代。因此,teerlink更喜欢将这个时代称之为增强智能时代,通过使用技术来增强人类对于信息处理的能力。
teerlink介绍说,使用sap机器学习软件的合作伙伴已经将算法转化成商业利润。他举了一个子:总部位于巴西的全球矿业公司vale利用机器学习实现了采购申请流程的优化。
当前的采购申请流程是一个硬手动流程,其中分散的信息分布在许多文件和系统中,因此,由于错误,每月有25-40%的请购单被拒绝。这导致大量返工。
过去几年,vale开始使用基于设计思维技术的sap leonardo开放式创新框架,定义了一个重新构想的申请流程,该流程提供了一个可从任何设备访问的sap fiori应用程序,可帮助用户端到端地完成流程,而无需登录任何设备后端系统。
用于图像识别的机器学习是该过程的核心,sap leonardo机器学习图像识别算法集成在应用程序中,以便维护技术人员通过拍摄零件图片来识别需要更换的任何备件的材料编号。即使没有互联网连接,技术人员也可以从部件中取出图片,并在以后完成采购申请流程。
一旦确定了部件,应用程序将连接到后端系统并找到该材料的正确采购程序,无论是合同还是采购申请,并自动完成采购申请流程,还要验证该部件是否已经在前一班次要求或是否存在于附近的任何存款中。
该程序简化并提高了采购申请流程的效率,减少采购的交付周期,减少备件库存,从而减少营运资金并提高劳动效率。
像vale这样很早就布局人工智能的企业已经尝到了甜头。据sap的观察,这些企业往往有以下的特质:c-level高管的战略中心、增加竞争差异化、新收入和盈利能力、覆盖整个企业范围内的战略。这些企业也都将数据当成重要的资产来对待。
darktrace技术总监dave palmer:ai如何影响网络犯罪
darktrace是一家英国网络安全初创公司,主要提供一套“企业免疫系统”,可以部署在公司网络之中,监听网络异常。一旦网络内部出现可疑行为,darktrace就会提醒it经理,而且在必要的时候,自动触发保护行为,减缓网络攻击。与依赖于规则或签名的传统方法不同,这些技术是自动化的,使安全团队能够专注于高价值的任务,甚至可以对抗快速移动的自动化攻击者。
技术总监dave palmer认为,ai将会极大程度增加网络犯罪对企业的影响,由于整个计算机科学的开源环境,以及大公司都会推出各种api&sdk,即使是没有相关背景的人也可以轻松获得并使用ai技术,无论是脸部识别还是语音识别,极大地降低了网络犯罪的门槛。
和过去植入一个病毒或者恶意软件还不同,现在网络攻击的形式多种多样,而且范围越来越广:比如偷取你的数据来进行勒索,监听竞争公司的重要会议,或者从底层修改你的数据来影响你上层的决策等等。
也因此,许多公司都在深耕网络安全防护,比如微软在2017年推出的风险安全检测。通过这种基于云的工具,开发人员可以使用它来查找准备发布或使用的软件中的错误和其他安全漏洞。该工具旨在在软件出现漏洞之前修补错误。
reddit高级总监anand mariappan:reddit机器学习发展历史
reddit公司搜索与机器学习工程高级总监anand mariappan回顾了reddito机器学习发展的历史、目前的项目、以及未来在该领域的努力方向,涵盖了数据平台、围绕feed排名、推荐、用户和频道相似性的机器学习工作。
reddit,又称美国版天涯+贴吧。根据alexa公布的数据,reddit是美国第五大网站,全球排名第14位,流量甚至超越facebook。目前reddit拥有3.3亿月活跃用户,将近14万个活跃社区,,每月有1200万个帖子和将近1亿的评论量。今年2月,腾讯向reddit注资1.5亿美元。目前reddit估值可达30亿美元。
reddit在过去几年不断在搭建和完善数据管道。从2014年开始使用amazon s3和hive,到慢慢基于midas搭建多层数据库架构,再到如今换成谷歌的bigquery。
reddit有14万个活跃社区(subreddit),也可以被理解成频道,给用户推荐相关的频道是增加用户参与度的重要方式。过去reddit都需要人来手工甄选。现在通过深度学习,reddie可以直接将一个频道里所有的评论全部集合到一个文件里,然后用端到端的doc2vec模型来训练,获得语义信息聊帮助匹配。
reddit对首页推荐也进行了优化,使用大规模逻辑回归算法,基于时间、频道、用户兴趣、设备等参数进行个性化内容推荐。
mariappan说,reddit目前也在开拓更多机器学习项目来做个性化模型的优化,而且通过使用tensorflow上的模型提高内容推荐质量,reddit已经在开发阶段早期取得了惊人的效果。
英国皇家邮政主管ben dias:从零到数据科学
英国皇家邮政(royal mail)高级分析和数据科学主管ben dias分享了他“从零到数据科学”的经历,总结归纳出7点要义,希望通过提供一些实用的技巧、工具和技术,帮助企业在数据科学之旅中加速前进。
第一点:做好准备。企业的第一步是认清自身,做好充分的准备,包括基本的数据处理、标准商业智能分析、底层架构和技术堆栈。
第二点:招人之前先留人,不要急着在外部寻找人才,而是充分开发和保留内部人才。在这个过程中也要培养内部的办公室文化。
第三点:不要招“超级鸡”。超级鸡指的是才华横溢、斗志盎然的员工。企业管理咨询专家margaret heffernan在一次tedtalk演讲中指出,往往团队里都是天才并不会带来更高的工作效率,反而还将带来灾难性的表现。成功的团队不需要超级明星,而是协作和共识。
第四点:不要把鸡蛋放进一个篮子里。公司需要有短期利益、中期考量、长期规划这三种不同方向的项目混合在一起。
第五点:采用精英创业模式。精益创业是一种开发业务和产品的方法,旨在缩短产品开发周期并快速发现拟议的商业模式是否可行; 这是通过采用业务假设驱动的实验,迭代产品发布和经过验证的学习相结合来实现。
第六点&第七点:你必须改变每个人每件事&将科学方法应用于一切。
just eat人工智能主管gilles comau:构建个性化战略的挑战和机遇
gilles comau是just eat的机器学习和人工智能主管。创立于2001年的just eat是发家于丹麦的外卖订购网站,提供应用程序让消费者方便地完成下单和支付,现已在全球多个国家开展业务。2014年,just eat成功在伦敦股票交易所上市,市值24亿美元。
comau的演讲围绕如何构建个性化战略的挑战和机遇,外卖服务涉及数百万个相似但又非常不同的产品,交付区域在地理上也存在局限性,这些都需要通过算法来进行优化。
just eat的大数据分析有助于预测在特定时间用户会订购哪种餐品。例如,使用just eat生成的大数据 - 分析师可以预测哪些区域最有可能订购健康食品,哪些区域更喜欢食品收集而不是交付。
用户的饮食模式和趋势的大数据分析结果会被提供给餐馆,以帮助他们满足各种需求,并增加菜单上的项目选择,这可以帮助他们增长业务。
just eat上有6000多万个账户,至少有750万人拥有多个账户。因此,just eat需要用数据科学对个体进行重复数据删除,并通过属性将身份联系在一起。
餐厅和用户之间的匹配有助于用户更方便地找到美食。餐厅的属性主要基于其主推的食物,包括风味、属性、口味、食材等决定;用户画像则通过点单习惯、喜好、社交属性、交易习惯、联系方式等决定。
这些属性将帮助just eat平台构建一个二维可视化的向量搜索空间,当用户搜索美食的关键词时,只要匹配该关键词和哪个向量靠的最近,就能找到答案。
如何快速地将订单送到客人手上,中间同样利用了机器学习,比如对司机路径的预测、通讯的效率保证每一个送餐步骤快速更迭、送餐的顺序、以及对丢失订单建模。