有关 [ 数盟 ] 的文章

教你用几行Python和消费数据做客户细分

编译:张秋玥、罗然、云舟 细分客户群是向客户提供个性化体验的关键。它可以提供关于客户行为、习惯与偏好的相关信息,帮助企业提供量身定制的营销活动从而改善客户体验。在业界人们往往把他吹嘘成提高收入的万能药,但实际上这个操作并不复杂,本文就将带...

米少熬好粥—数据有限时怎样调优深度学习模型

迁移学习 所谓迁移学习,就是将一个问题上训练好的模型通过简单的调整,使其适用一个新的问题,可以认为是一种模型调优的“取巧”方法。可以类比人的举一反三能力。 迁移学习的特点 1、需求数据量少 假设有两个领域,一个领域已经有很多的数据,能成...

如何优雅地从四个方面加深对深度学习的理解

在今年的 ICML 上,深度学习理论成为最大的主题之一。会议第一天,Sanjeev Arora 就展开了关于深度学习理论理解的教程,并从四个方面分析了关于该领域的研究:非凸优化、超参数和泛化、深度的意义以及生成模型。 2017 年 12...

YARN & Mesos,论集群资源管理所面临的挑战

在国内,大部分的Spark用户都是由Hadoop过渡而来,因此YARN也成了大多Spark应用的底层资源调度保障。而随着Spark应用的逐渐加深,各种问题也随之暴露出来,比如资源调度的粒度问题。为此,7月2日晚,在CSDN Spark高端...

以企业入侵检测日志分析为场景漫谈大数据安全

前言 写这篇文章有三个原因,一是在工作中一直艰难地摸索着这块也曾写过一篇很粗略的大数据之安全漫谈 (想继续吐槽);二是看到了阿里的招聘广告-一起来聊聊这个新职位:大数据安全分析师;三是整个2015的RSA会议 Intelligence D...

解析:数据中心六大节能方法

数据中心属于能耗密集型产业,从网站到网上银行,现代数据中心几乎运行着一切信息应用,因而其对电力的消耗增长显著,大规模数据中心更是能耗巨大,数据中心能耗成本往往占据数据中心总体运营成本的50%以上,让数据中心的运营单位不堪负重。现在的数据中...

如何用Python编写你最喜欢的R函数?

本文介绍了采用创建一个Python脚本,用该脚本模仿R风格的函数的方法来方便地进行统计。 是用R语言还是用Python语言?这是一个旷日持久的争论。在此,我们可以尝试采用折中路线:创建一个Python脚本,用该脚本模仿R风格的函数,来方便...

从前有棵树,叫高数,树上挂了很多人!

你知道吗? 在AI时代,互联网、金融界、IT界、科研界等高速发展领域都离不开一门强大的学科——数学。 互联网行业中,数据结构与算法、建模、前端开发等方向普遍运用数学原理: 高等数学、数理统计、线性代数、离散数学中的枚举、...