曾在NBA尼克斯工作赴美读博学体育他想帮姚明为中国篮球分析数据

2018-12-06 13:25

曾在NBA尼克斯工作赴美读博学体育他想帮姚明为中国篮球分析数据



  今天,圈哥就给大家带来一个篮球数据分析大神的故事,希望在未来,唐淼这类心酸故事可以远离我们的赛场,而数据分析可以助推中国体育跑的更快一点。

  下午两点,艳阳高照,南卡罗来纳大学体育与娱乐管理系的2046办公室,身穿粉紫色格子衬衫的龚骅正在电脑前凝神思考着什么,我的敲门声打断了他的思绪。

  这是他在南卡州首府哥伦比亚读体育管理博士的第三年,此前,龚骅在NBA球队尼克斯做过数据分析工作,再早些时候,他在民风剽悍的德州拿到了体育管理硕士学位,高高大大的身材显露出了他曾经大学校篮球队球员的身份。

  凭借多年积攒起来的学科声誉和一干具有职业球队工作经历的教授,南卡大学的体育与娱乐管理常常在各大体育管理专业榜单的前列出现。南卡整个州内没有任何一支美国四大联盟球队,不过南卡大学的男子橄榄球,男、女篮,以及他们与1小时车程之外的克莱姆森大学间的“世仇”,总是被当地人津津乐道。

  相比早先在纽约工作时身处繁华大都市,在南卡大学读博这三年,龚骅的经历更具“结庐在人境,而无车马喧”的况味。大学主修经济学的他,在南卡大学研究体育经济方向,除了日常的阅读和研究之外,他不仅修了其他两门课、还要给低年级学生上两门课。

  即便是体育管理这样光听起来就充满活力的专业,读博也是一个需要坐冷板凳的过程。

  美国体育管理专业博士的毕业年限大概在三到四年,临近毕业的龚骅告诉我,他目前打算先寻找在美国大学任教的机会。而他读博期间倾注心力搭建起来的一个篮球数据网站“GG篮球”,会是另外一个着力点。

  比起从硕士到工作、再到博士的这个过程,其实数据分析是龚骅体育相关经历中更为明晰的线索。

  读硕士期间,他在德州农工大学篮球队工作时,会跟着球队到州外跟其他学校比赛,连续数日高强度的工作是常有的事。

  不过借此机会,他也见识了到美国校园篮球完备的球队体系,包括视频录像分析、数据分析等等。为了降低未来进入美国职业球队的竞争压力,龚骅选择了自己相对擅长、同时难度也更大的数据分析领域切入。

  “一方面是选修其他学院的相关课程,一方面是根据职位描述自学的相关内容。”龚骅说。

  在他的技能包中,包括编程语言Python,R语言,SQL等等,可以想见,整个学习过程颇为不易。

  学习不易,应用更难。在美国,职业联赛球队数量有限,可提供给龚骅的职位选择也就很有限,而每一个职位后面都可能有数百个美国本国青年正排着长队孜孜以求。

  但龚骅还是拼力一试。5月硕士毕业,他从2月就开始投简历,发邮件。从2月到8月,总共发了100多封邮件,经历了不知道多少轮面试和电线人职位的过程中,他经历了7轮面试,但在最后一轮被筛选出局。说到这里,龚骅的笑容有点苦涩。

  2015年10月他来到大苹果城,在皇后区的法拉盛安顿下。龚骅的工作在平日里朝九晚五,这时他都会驱车前往工作地点;而到了比赛日,则需乘坐1小时的地铁前往尼克斯主场麦迪逊广场花园。

  在比赛现场,他的主要工作任务是帮助联盟的SportsVU系统进行数据的录入——比如场上球员的跑动速度、每位球员的突破次数等等,事后这些数据都会在NBA官网得以呈现。通常他完成工作都在晚上12点之后,接着再坐地铁回家。

  第二天早上,龚骅7点甚至6点就要开始工作,他会根据团队主管的要求完成前日晚上的球员表现报告。当ESPN、Fox、腾讯这些媒体在为球迷生产赛事内容的时候,更加深入的球员分析会经由数据分析团队的手交到球队高层手中。

  龚骅在尼克斯的那一年,“禅师”菲尔-杰克逊还在任上,虽然尼克斯常年处在球迷口中“烂泥扶不上墙“的状态,并且后来禅师也黯然离去,但从龚骅口中得知,仅从数据分析部门来看,无论战绩好坏,他们一直都在极为职业得做着自己的工作,给球队提供更为科学合理的参考。球队战绩往往牵扯太多因素,并不能简单归因一处。

  搜集数据、存储数据、数据建模、分析数据和数据可视化,而一切数据都围绕球员展开。

  2016-2017赛季,被交易后的德里克-罗斯效力于尼克斯。数据团队会结合罗斯的历史数据、年龄及伤病史,分析和预测他在未来的表现,最终评估其续约价值。

  一年的工作时间里,尼克斯和龚骅“郎情妾意”,彼此都从对方身上收获了巨大的价值。只是无奈于签证问题,尼克斯最终只能是他旅途中的一家驿站。

  “除了日常工作之外,当时我也帮助球队设计了很多可以快速查询数据的软件,球队对我很满意。而整个工作过程中,我熟悉了更多球队注重的数据指标,也得到了很多跟资深球探、球队总经理或副总经理接触的机会,这让我在球队的运营管理方面有了更深的理解。”龚骅说。

  就像菲律宾裔的斯波尔斯特拉,从多年前球队的录像剪辑师,变成如今的热火队主教练一样,如果能留下,那么龚骅可能会开启他在职业球队内部的职级爬坡之旅,若干年后成为数据团队主管、甚至莫雷式的数据分析型总经理也未可知。当然,这一切目前都只能是“如果”。

  “如果我在职的话,一些数据会涉及球队机密,没办法发布出来给公众。”而在离开尼克斯之后,龚骅也草创了GG篮球这样一个数据网站。

  登录“GG篮球”的网站,可以看到数据分析文章,NBA数据库和CBA数据库这三大部分内容。数据分析文章主要由龚骅的两位合作伙伴完成,而整个网站的搭建、数据的抓取、清洗和录入都由龚骅独自完成。

  2017年,他花了几个月的时间陆陆续续完成了网站的基本内容,而后每天都会花上一定量的时间进行网站迭代和数据更新。每个月,他会为搭建网站的服务器支付20美元的费用。

  “GG篮球”最初的定位是做NBA相关的数据分析内容,后来因为市场上同质产品众多,龚骅和他的合伙人决定以CBA数据为突破口,之后再考虑铺开业务深入涉足NBA数据。相比于美国各大联赛的数据库,国内赛事的数据统计,无论是从设备技术,还是工作人员素质都还处于比较原始的阶段。但球迷们对CBA数据日益有了更大的需求。

  事实上,在过去很多年里,CBA的数据统计没有形成一个固定的体系,目前的CBA官网上也仅有最近两个赛季的数据,且数据大多比较简略,信息价值也有限。

  由于缺乏统计手段,“GG篮球”目前做的主要是对通过整合国内各大门户网站和CBA官网的数据源,在进行数据清洗之后,形成一个更为完善准确的数据库。

  对于龚骅来说,数据清洗是最伤脑筋也是投入时间最多的一部分。比如,CBA官网上只记录了球员的三分球命中率和三分球命中次数,没有三分球出手数的数据,那么为了数据更加完整,就需要通过两分球的相关数据来进行推算。比如,CBA官网没有球员上场时间的数据,那么就需要从其他网站调用。

  事实上,龚骅团队现在在做的这件事情,很容易让人联想到美国最大最权威的NBA数据网站Basketball Reference(以下简称“BBR”)。其创始人Justin Kubatko有应用数学的教育背景以及数据分析的工作经验,除了详尽的基础数据外,在BBR上你可以查阅到大量球员和球队的个性化数据,乃至可以通过设置相关参数搜索到对应的球员。

  显然,这一方面是网站数据处理能力的体现,一方面也得益于NBA已经成熟稳定发展多年。而对于CBA数据来说,后者是难以在短时间内弥补的,还需要一代篮球人的不懈努力。

  比如建立一个评测外援跟球队匹配度的系统、分析一支球队的最佳阵容组合等等。而近期,他的愿望是自己的网站能够得到更多球迷的关注,让他付出的心血真正为人所用。

  早年间,BBR上的一些早期数据得以完善,人的作用非常重要——一位密歇根州的高龄老人,出于对篮球运动和数据统计的热爱,他从上世纪40年代末就开始通过各地的报纸收集比赛的数据统计表格,保存下了大量的篮球数据史料。

  与此同时,一家名叫Baseball Reference的数据网站,也由其创始人Sean Forman在2000年一手操办起来。当时,从小热爱高尔夫和棒球的Forman刚刚在爱荷华大学读完应用数学博士,在圣约瑟夫大学开始他的教职生涯。那个时候,Forman每个月为网站服务器支付25美元。

  从草创到拥有如今的庞大数据库,在美国这样的土壤中,也走过了近20年的时光,因此,在国内,体育数据分析同样是不能急于求成的。

  近几年,国内体育数据领域有几家公司先后完成了不同轮次的融资,不过更多集中在足球领域。篮球领域最为知名的是贝泰科技,他们已经深耕体育数据十多年,并在2016年拿到微赛体育的A轮融资,投后估值8500万人民币。目前贝泰科技服务于CBA、NBA以及国内外多家体育媒体,在业务方面则跟国际数据公司Sportradar达成了合作。

  还好,大环境依然是昂扬的。就拿篮球领域来说,中国男、女篮刚刚在亚运会双双夺冠,CBA在篮协主席姚明大刀阔斧的改革之下,也喜人地逐步迈上了新台阶。对于中国体育产业来说,想要取得长足的发展,无疑也需要每个细分领域都得到提升,在这之中,数据分析无疑是不可忽视的一环,这也给其中的公司与个人提供了潜在机遇。

  站在自己的“2000年”,龚骅与整个行业都有机会赶上中国篮球和CBA成长的这辆列车。虽然龚骅的项目仍处于早期阶段,但他已经做好了准备,想要长期投入到这项他热爱且擅长的工作中,想要为中国体育数据事业贡献自己的全部力量。