【高手访谈】AdMaster技术副总裁谈Hadoop、营销数据、Python和挖掘平台

机器学习 4193 Views

数盟倡导”数据创造价值“,致力于打造最卓越的数据科学交流平台,为企业、个人提供最卓越的服务】

卢亿雷是现任AdMaster技术副总裁,曾在联想研究院、百度基础架构部、Carbonite China工作,关注高可靠、高可用、高扩展、高性能系统服务,以及Hadoop/HBase/Storm/Spark等离线、流式及实时分布式计算技术。他对分布式存储和分布式计算、超大集群、大数据分析等有深刻理解及实践经验,对Lustre、HDFS、HBase、Map/Reduce、Storm、Spark等有很深的理解。曾在联想研究院、百度基础架构部、Carbonite China工作。2006年硕士毕业,一直从事云存储、云计算开发及架构工作,多年Hadoop实战经验,专注于分布式存储、分布式计算、大数据分析等方向,有两个发明专利,《一种分布式文件系统及其数据访问方法》和《一种数据备份的版本管理方法及装置》。曾多次被51CTO、CSDN、IT168、阿里技术邀请为嘉宾分享Hadoop大数据在互联网的应用。

在今年的QCon上海大会,他将分享Hadoop在营销数据挖掘方面的实践。在本次邮件访谈中,他谈到了营销数据的重要性、Python做数据挖掘的易用性以及他对Hadoop相关平台的看法。

InfoQ:营销数据是跟用户最紧密相关的数据,近年来也获得了高度关注,请您谈谈当时为什么选择这个领域呢?

InfoQ:您在数据挖掘过程中,是不是通常使用Python?看了您在PyCon China的演讲,想听您给介绍一下这部分工作,为什么用Python?
InfoQ:数据量大了以后,异构、海量、错误数据层出不穷,对此您是如何应对的?
InfoQ:AdMaster是广告数据挖掘的领先团队,请您介绍一下AdMaster的情况?
InfoQ:大数据时代对用户隐私保护实际上是有很大挑战的,您的团队在挖掘过程中是如何应对隐私问题的?
InfoQ:Hadoop衍生了很多数据挖掘工具,如Spark、Storm等等,您是如何看待这些工具之间的区别和联系的?
InfoQ:您觉得海量数据挖掘浪潮里面最关键的技术是什么?
张天雷(@小猴机器人),清华大学计算机系博士,熟悉知识挖掘,机器学习, 社交网络舆情监控,时间序列预测等应用。目前主要从事国产无人车相关的研发工作。

From: InfoQ

更多精彩,点击可得~

如未说明则本站原创,转载请注明出处:NULL » 【高手访谈】AdMaster技术副总裁谈Hadoop、营销数据、Python和挖掘平台