有关 [ 机器学习与数据挖掘实践 ] 的文章

我爱听什么?

demo.png PIL numpy matplotlib wordcloud #-*- coding:utf-8 -*-import osfrom PIL import Imageimport numpy as npimport mat...

从电商评论数据看锤粉

文章来源:https://zhuanlan.zhihu.com/p/27132793 距离锤子坚果pro发布会已经过去快一个月了,我们今天不讨论坚果pro是否能够成为拯救锤子的逆袭之作,我们从电商评论的角度来看看,卖了快一个月的锤子网上...

一次Kaggle比赛的后记

PS 本文假设读者对 Machine Learning 的基本概念和常见模型已经有一定了解。 Enjoy Reading! 1 传统文本特征2 词向量特征 1 研究最新的关于文本相似性的论文,从论文中获取灵感。并且,我们将论文中的一些算法...

  • 2017-06-17
  • 2799 Views
  • 未分类
  • joe

当数据分析遇上你的微信

文章来源:https://zhuanlan.zhihu.com/something-python 微信网页版,扫码登录后去抓包爬取信息,还可以post去发送信息。 itchat这个开源项目,作者是@LittleCoder,已经把微信的接口...

  • 2017-05-25
  • 4495 Views
  • 未分类
  • joe

欺诈预测机器学习模型设计

Airbnb网站基于允许任何人将闲置的房屋进行长期或短期出租构建商业模式,来自房客或房东的欺诈风险是必须解决的问题。Airbnb信任和安全小组通过构建机器学习模型进行欺诈预测,本文介绍了其设计思想。假想模型是预测某些虚拟人物是否为“反面人...

  • 2017-05-20
  • 4457 Views
  • 未分类
  • joe

统计新浪微博各类表情使用频率

利用新浪微博API积累了微博广场的1.4万条数据并将其保存为TXT文件,然后利用python处理文件来统计表情的内容,并做相关的统计。 1. API下载微博广场数据 步骤思路:初始化API的Weibo类,设置Token后,设置下载间隔...

  • 2017-05-02
  • 38 Views
  • 未分类
  • joe

经典:编程面试的 10 大算法概念汇总

以下是在编程面试中排名前 10 的算法相关的概念,我会通过一些简单的例子来阐述这些概念。由于完全掌握这些概念需要更多的努力,因此这份列表只是作为一个介绍。本文将从Java的角度看问题,包含下面的这些概念: 1. 字符串 2. 链表 3....

  • 2017-04-24
  • 3542 Views
  • 未分类
  • joe

恋人分手的最大可能性在5.6.7月

不论“大数据”概念是不是个陷阱,我们的时代,互联网巨头坐拥海量信息是无人可以否认的事实,社区产品和社交产品赖以生存的基础就是从用户那儿来的数据。 Facebook知道你什么时候跟别人约会,什么时候分手——对,就这么简单。 和传统线下结为恋...

  • 2017-04-01
  • 3647 Views
  • 未分类
  • joe

百度数据挖掘工程师校招分享

笔试题: 一、简答题30分1. extern”C”{}的作用好应用场景;2.写出两者你熟悉的设计模式,及应用场景,可以给出伪代码;3.TCP中time_wait是表示那种状态,及应用场景,以及起好处和坏处。 二、算法题40分 1. 有...

  • 2017-03-29
  • 4710 Views
  • 未分类
  • joe

做数据挖掘的这些年

所谓算法,并不是说那些复杂的数学模型才是算法,哪怕是你写的一个简单的计算公式,只要能够解决现有业务的痛点,有了自己的模型思路,它就是一个算法,只是它可能不够通用,只能解决特定业务需求而已。 这些年,我开过的挖掘机 (1)最早接触的应该...

  • 2017-03-28
  • 1428 Views
  • 未分类
  • joe

算法复杂度(大O)速查表

这篇文章覆盖了计算机科学里面常见算法的时间和空间的大 O复杂度。在参加面试或者笔试时,通常会有比较各种查找或者排序的优劣。为了节省大家的时间,过关斩将,大家熟记这张表吧。 数据结构操作    数组排序算法    图操作    ...

  • 2017-03-25
  • 4355 Views
  • 未分类
  • joe