首届阿里巴巴大数据竞赛在今年“双十一”进入最后的激烈角逐。
柯国霖(左一)和他的部分参赛伙伴。
比赛对我最大的震撼是看到学术界和工业界的差别。在学术界,你可以编制出很完美的算法模型,但数据可能需要“跑”几个星期甚至一个月,才能得出结果。
——提到让自己获得第一桶金的比赛,23岁的柯国霖很清醒。
厦大学生柯国霖和其他高校学生组成的一个六人团队,用算法成功“逆袭”阿里巴巴工程师,获得阿里巴巴大数据竞赛的100万元奖金,他们获胜的原因是比后者更加准确地推断今年“双十一”顾客的喜好。
用大白话来说,在今年天猫“我的双11”页面中,部分推荐和展示的商品,就是根据这厦大研究生柯国霖和他的小伙伴的数据算法得出的,“双十一”的真实成交也证明,他们推荐的商品被顾客购买的成交率,高于阿里巴巴工程师组成的算法团队。
23岁的柯国霖本科就读厦大软件学院,目前是厦大软件学院研二学生。他昨日接受本报采访,证实了此消息。他透露,六人将平分100万元。其他五名学生分别来自南京大学、中国科学院大学、北京航空航天大学、南京航空航天大学,都是就读计算机或软件工程的研究生,都是“90后”。
A
临时组成六人团队
和专家对抗
23岁的柯国霖本科就读厦大软件学院,目前是厦大软件学院研二学生。第一届阿里巴巴大数据竞赛始于今年3月份,14个国家和地区的7000多支团队的1.5万多名大学生报名参加,既有清华、北大的高材生,也有牛津大学、诺丁汉大学的洋学生。
参赛的国内外大学生一般组成团队,第一季比赛淘汰了绝大多数队伍,只留下10支队伍参加第二季比赛,柯国霖是其中之一。
相比较第一季的20万用户数据,这回给的是5亿用户数据。在七支队伍被淘汰后,三支队伍进入最后的第三赛季。原本的计划是,包括柯国霖在内的三支队伍,要和阿里的工程师队伍比赛,争夺奖金为100万元的第一名。
不过,大学生们当时仔细分析了形势:他们要面对的阿里巴巴工程师团队已经是行家里手,与其“自相残杀”,倒不如化“敌”为友,三支队伍合并,一致对外。这并没有违反比赛规则,阿里巴巴同意了。
他们的“双十一”推荐
更受用户欢迎
9月20日,在阿里巴巴登陆纽交所上市时,柯国霖和他的五位小伙伴也在杭州开始最后一个赛季的角斗,白天他们到阿里巴巴上班,晚上回到租住的简陋旅馆,和时不时闹罢工的热水器做“斗争”。在这一赛季,他们获得上百亿用户行为的数据。
柯国霖说,比赛比的其实是算法模型的建立,以此分析用户在天猫上的行为习惯和品牌偏好,并预测他们下一步可能会购买的商品。
他举例说,如果你经常浏览衣服,那么我们就会根据你浏览的周期在首页推荐衣服以及裤子、皮带、鞋子等搭配品,而如果你这次购买了手机,下一次我们就会推荐手机壳、电源等。
在大数据里,这些都可以形成算法模型。换句话说,这些大学生就好比“推荐专家”,判定用户买什么东西可能性大,并根据可能性的大小依次在首页推荐商品。
最后的比赛也是“真刀真枪”——双方选出各10%用户的“双十一”的真实成交量,看看哪一方的推荐更靠谱。
结果在11月12日凌晨就诞生:大学生团队开发的首页的成交率比阿里巴巴工程师高出16.14%。
C
忙了八个多月
赛后连睡十几个小时
事后,阿里云计算机官方微博称他们是“了不起的90后”——短短一个多月的时间,就凭借精准的算法成功逆袭了天猫的算法团队。
不过,六个“90后”当时错过结果揭晓的激动人心的时刻。柯国霖说,太累了,我们都回去睡觉了。他们一直睡了十几个小时,以至于过了一天才获知自己“逆袭”了阿里巴巴工程师。
颁奖仪式在上周举行,柯国霖没有见到马云,据说“马总太忙了”。学生们从阿里巴巴集团CTO王坚手上接过了一张一百万元的支付宝支票。根据事先约定,六人将平分这100万元,扣除税收,每人大约能得13万元。
不过,这笔钱现在还没到手。和他的伙伴一样,柯国霖也不认为这值得大惊小怪——从三月份起,他们当了八个多月的技术宅男,酷爱骑行的柯国霖几乎停止一切运动,因此胖了十斤。
这位晋江人最近根本没有时间考虑如何处置自己的第一桶金,他正忙着补觉,把失去的时间睡回来。
柯国霖说,比赛对他最大的震撼是看到学术界和工业界的差别。他说,在学术界,你可以编制出很完美的算法模型,但数据可能需要“跑”几个星期甚至一个月,才能得出结果。柯国霖说,这种模型不是工业界所需要的,后者需要的是一个小时就能跑完的模型。