畅销书《大数据》作者涂子沛目前从美国硅谷来到杭州,正式出任阿里巴巴集团任副总裁,分管大数据方面事宜。
涂子沛告诉记者,他的职责主要有三个:一是研究数据方面的新商业模式,二是推动阿里云的国际化战略,三是帮助阿里开展政府及公共领域的大数据项目。
41岁的涂子沛在最近两年出版了两部热门畅销书:《大数据》和《数据之巅》。现任中共中央政治局委员、国务院副总理汪洋曾推荐《大数据》一书,称“看后非常有启发,大数据对政府部门有重要意义。”除了大数据外,涂子沛的研究领域还包括:云计算、智慧城市、互联网金融等。
公开资料显示,涂子沛毕业于华中科技大学计算机系,在武警边防部队、政府部门工作过10年,期间参加过几个全国大型系统的开发,独立开发了全国第一个反偷渡遣返信息管理系统,还担任过边防巡逻艇的指挥官。2006年,涂子沛来到卡内基梅隆大学读书,成为年龄最大的留学生。毕业后,在美国几个软件公司工作,担任过数据仓库程序员、数据部门经理、数据中心主任、亚太事务总监、首席研究员等职务。
据了解,涂子沛还将是阿里的“神秘部门”——IDSG(Institute of Data Science&Technologies)三位负责人之一。
IDSG直译为“数据科学和技术研究院”,但并没有官方中文名。据阿里此前披露,IDST承担的重要职责是推进集团的前瞻性研究与应用,希望以此来确立阿里巴巴集团在未来数十年的领先地位。“Big Data(大数据)今天没有定论,IDST的使命之一就是定义这个不确定性。”一位阿里巴巴集团高管表示。
其实,这样的部门在互联网巨头中很常见,但都保持着神秘色彩,例如Google X、百度深度学习研究院等,都承担着公司下一步产品走向的任务。
涂子沛是近段时间以来,又一位加盟阿里的科学家之地。最近阿里招了许多科学家进入到IDST。
阿里的这些科学家来自机器学习、大数据挖掘、自然语言处理、移动搜索、多媒体识别等各个领域,在阿里已经研究数月。阿里称,未来将在美国西雅图、硅谷、北京、杭州等地组建专门的科学团队。
不完全统计,此前加盟IDSG的科学家还有:
- 漆远:普渡大学计算机系和统计系两个系的终身教授,擅长机器学习和人工智能,为全球机器学习顶级会议ICML 2014和ICML2015的主席。
- 金榕:美国密歇根州立大学终身教授,曾担任NIPS、SIGIR等顶级国际会议领域主席,获得过美国国家科学基金会NSF Career Award。
- 司罗:美国普渡大学计算机系终身教授,在卡内基梅隆大学获得博士学位之后,其研究重点包括分布式信息检索、机器学习、多媒体数据处理与挖掘等。
- 曹宇:加州理工学院物理学博士。
履历:
涂子沛,江西吉安人,著名信息管理专家、科技作家,先后担任中国旅美科技协会副主席、中国旅美科技协会匹兹堡分会主席,在国内有上海真爱梦想公益基金会理事、中国人民大学中国调查与数据中心客座研究员等兼职。毕业于卡内基梅隆大学,系微软认证高级程序员。
本科毕业于华中科技大学计算机系。后在武警部队和政府部门工作十年,期间开发过全国第一个反偷渡遣返信息管理系统,担任过边防巡逻艇的指挥官,多次立功受奖。后辞去公职赴美读书,获卡内基梅隆大学公共管理硕士、信息科学硕士学位。在美期间,先后担任软件公司的数据仓库程序员、数据部门经理、数据中心主任、亚太事务总监、首席研究员等职务。曾为《南方都市报》、《时代周报》、艾瑞网等多个报刊网站撰写专栏。
著有《大数据》、《数据之巅》。
精彩语录:1、“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。(《大数据》,P57)
2、数据收集和数据分析必须成为基层部门的一种文化,一种管理哲学。(《大数据》,P82)
3、收集数据、使用数据、开放数据,都是大数据时代我们中国人需要一一面对的挑战。这三大挑战,没有一个不是任重道远。但这些挑战,也是我们在大数据时代彻底摘掉“差不多先生”文化标签的重大历史机遇。如果在这个数据意义凸显的时代,我们还抓不住这些历史机遇,继续漠视数据、拒绝精准、故步自封,等待我们的,还将是一个落后的100年。(《大数据》,P333)
4、大数据不是矿藏,而是土壤,开放的数据即为土地上的河流,河流流过之处,就会孕育起发达的数据文明。(采访)
5、数据之巅的“颠”有三个维度: 一是技术维度,即人类使用数据的巅峰形式是让机器使用数据, 通过机器学习实现智能化;二是文化维度,登上数据之巅,俯览数据文明的兴起; 三是政策维度,大数据的建设需要站在巅峰之上的顶层设计。
6、数据就是静态的历史,历史就是动态的数据。历史的碎片,就是游离的数据;历史的迷雾,就是模糊的数据;历史的盲点,就是缺失的数据。用数据构建的历史,因为精确的细节而永远鲜活,数据越丰富,后世的历史学家也就越能经由数据更好地再现当时的社会。(《数据之巅》,P336)
7、数据文化是尊重事实、强调精确、推崇理性和逻辑的文化。数据文化的匮乏,是中国之所以落后的一个重要原因;建设这种文化,中华文明的面貌将焕然一新。(《数据之巅》,题记)
本文网址: