欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

任谦:实践是大数据提升项目的灵魂

程序员文章站 2022-04-08 18:21:49
...

  [ 导读 ] 清华-青岛数据科学研究院(以下简称“数据院”)自2014年4月成立以来,秉承“学校统筹,问题引导,社科突破,商科优势,工科整合,业界联盟”24字指导方针,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才。

  由清华大学研究生院、数据科学研究院及相关院系共同设计组织实施的“清华大学大数据能力提升项目”,通过整合建设课程模块,形成大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,提升学生大数据分析能力和创新应用能力。

  截至2021年6月,已有来自31个院系的271名同学获得了“大数据能力提升项目”证书,其中信息类同学160人,非信息类同学111人。

  大数据提升项目究竟为同学们带来了什么改变?下面,就让我们聆听优秀毕业生们与大数据结缘的故事,一起发现大数据对他们学习、科研和创业的启发与帮助吧!

  任谦是清华大学软件学院硕士六字班的2022届毕业生,即将入职海南牛津区块链研究院,从事区块链隐私保护的相关研究。大数据能力提升项目的学习经历带给他的不仅仅是大数据相关的知识体系建构,更有在实践中亲身操作、密切联系业界获得的真知。

  实践是大数据能力提升项目的灵魂

  2021年秋季新学期伊始,任谦通过“大数据能力提升项目”招新宣讲会,与项目初识。他主动联系数据院相关老师并取得培养方案,还在选课系统中查找了相关课程介绍。在全面了解项目之后,任谦发现大数据能力提升项目的培养目标和自己的兴趣方向十分契合,项目中的《大数据实践课》更是以其独到的课程设计提升了他的期待值。审慎思考之后,任谦参与了当年的大数据能力提升项目。事实证明,他在大数据能力提升项目的学习中获得了自己想要的知识与体验,而当初抱有最大期待的实践课,也果真成为了让他收获最丰的项目课程之一。

  在项目的学习中,任谦印象最深的课程有两门,分别是《大数据系统基础(B)》和《大数据实践课》。这两门课的共同特点在于重视实践,项目推动,注重专业的多样性。以具体的生产科研项目为依托,在实践中实现知识的应用与提炼;充分发挥多专业学生共学优势,强调团队协作。这样的教学理念与方式给了学生更坚实、更肥沃的成长土壤。

  《大数据系统基础(B)》课程的优势在于其完整性。课程内容涉及了大数据基础设施(GFS文件系统),处理框架(MapReduce编程模型,Hadoop),内存计算(Spark,Scala语言),NoSQL等。涵盖了大数据相关的理论、工具还有实践项目,课程框架完整,具有全面性。除内容外,课程的授课教师也具有多样性和针对性。“这门课让我对大数据的概貌有了很精准的理解。”

  任谦多次强调,对他而言,让他受益最大,印象最深刻的,应当是贯穿整个暑假的《大数据实践课》。作为一门实践课,该课程真正将实践性做到了极致。完成实践的过程就像参与一场“悬赏”:在学校的桥接下,多家企业提出自己在生产实践中遇到的实际问题,以此为基础形成项目,交由学生队伍着手研究,尝试解决。这些项目有一定的成果需求,但更为学生保留了广阔的开放探索空间。同时,在实践队伍成员构成上的多院系背景设计,也为团队协作分工和思维碰撞提供了契机。

  以任谦自己参与的项目为例,他们的任务是提取智能手机的传感器数据进行用户的行为识别。在最初的目标设定中,除了公司希望学生完成的行为识别外,他们还可以探索能耗、深度学习识别优势等其他方面的问题。“项目切合实际,也给了我们很大的*度。”任谦的团队里六位同学分别来自软件学院、计算机系、电子系、电机系、建筑学院、自动化系六个不同的院系。根据同学们不同的院系背景和调研能力、编程能力、文献阅读整理能力等不同的技能点,团队实现了明确的分工。确定问题和队伍后,整个暑期,他们都以类似实习生或研究员的身份投入公司项目的研究中,与一线员工对接资源和需求。

  由于能够与业界实现直接深入的接触,任谦得以跳出专业学习的固有圈子,深刻认知大数据在产业实际应用中的难点与重点所在。在设定用户行为识别的数据搜集方式时,任谦的队伍原本想通过实时搜集数据进行分析。但企业的工程师告诉他们,由于用户对信息搜集提醒较为敏感,实时搜集用户的GPS等数据可能会引发用户反感进而卸载应用,因此这种方案虽然高效,却缺乏可行性。这只是实践过程中的一个小例子,企业的参与让他们了解业界动态、获取最新资源、提出更具可操作性的方案成为可能。“和公司协作完成一个项目,他们能提供很多对于学校和个人而言很稀缺,但对公司而言却很充裕的资源,这对我们有很大的帮助。”

  “能够在两个月时间内完整地完成一个大数据项目,对接公司的需求,踏踏实实走下来,这是这个函授项目的灵魂。”这样的体验,是平常的教育教学很难提供给任谦的。不过,这次大数据实践带给他的收获,还远远不止于此。

  一次值得阐述的出彩经历

  任谦坦言,自己即将入职从事的区块链隐私保护研究工作,与大数据的相关性并不明显,而是更多与他此前的科研方向挂钩。但是,在走向工作岗位的路上,大数据项目的学习,尤其是实践课的历练,却是他坚实的桥梁,给了他强大的助力。

  在腾讯(深圳)实习期间,大数据的能力背景为任谦的安卓应用测试算法后台搭建提供了数据搜集、存储、清洗、分析等方面的实操经验。而在正式工作的面试中,大数据能力提升项目中的这次实践由于其项目的完整性、实际性,成为了任谦简历中出彩的一笔,也成为了他面试阐述中的一个亮点,是一个具有强大说服力的加分项。“这么一个具有完整性、与公司实际相结合的项目成为了我工作经历中的一个部分,是我项目经验和能力培养的证明。”

  参与度决定收获度

  自驱、主动,这是任谦在回忆项目学习的经历时,不断强调的态度重点。

  以实践为例,在项目最初,企业所提供的目标和问题难点都是比较模糊的,如果没有不断与公司进行沟通的主动性,自觉地去了解公司的真正需求,向公司争取所需的数据和资源,而是完全按照最初的基本要求完成任务,其实并不能达成公司的期待,对个人能力的提升也并不显著。而在项目具体的推动过程中,所有的进度安排和任务量也是团队成员自己安排,因此,强烈的主动性是进步与收获的前提。面对主动出击的学生,项目也会给出最好的回馈。

  参与度决定收获度。

  这既是任谦在项目学习中的实在感悟,也是他对以后将要学习大数据能力提升项目的同学的重要建议。

  2021毕业季已至,清华大学大数据能力提升项目也已经迎来了第三批毕业生。大数据能力提升项目正在为越来越多像任谦这样的学子提供成长的平台与进步的机遇。也愿更多对数据科学有兴趣的同学能参与进来,从中受益,在让大数据发挥魅力的同时,也找到自己的志趣所在、心之所向。