有关 [ 机器学习与数据挖掘实践 ] 的文章

一起来坚持吧!

     上一篇文章提到了24个终极数据科学项目,为了更好的整合自己过去的知识,以及磨练对不同项目的理解和上手熟练度,接下来将会对这24个项目从数据理解—数据分析—模型构建—模型调优等方面逐一进行练习,希望自...

我爱听什么?

demo.png PIL numpy matplotlib wordcloud #-*- coding:utf-8 -*-import osfrom PIL import Imageimport numpy as npimport mat...

从电商评论数据看锤粉

文章来源:https://zhuanlan.zhihu.com/p/27132793 距离锤子坚果pro发布会已经过去快一个月了,我们今天不讨论坚果pro是否能够成为拯救锤子的逆袭之作,我们从电商评论的角度来看看,卖了快一个月的锤子网上...

一次Kaggle比赛的后记

PS 本文假设读者对 Machine Learning 的基本概念和常见模型已经有一定了解。 Enjoy Reading! 1 传统文本特征2 词向量特征 1 研究最新的关于文本相似性的论文,从论文中获取灵感。并且,我们将论文中的一些算法...

  • 2017-06-17
  • 1030 Views
  • 未分类
  • joe

当数据分析遇上你的微信

文章来源:https://zhuanlan.zhihu.com/something-python 微信网页版,扫码登录后去抓包爬取信息,还可以post去发送信息。 itchat这个开源项目,作者是@LittleCoder,已经把微信的接口...

  • 2017-05-25
  • 4951 Views
  • 未分类
  • joe

欺诈预测机器学习模型设计

Airbnb网站基于允许任何人将闲置的房屋进行长期或短期出租构建商业模式,来自房客或房东的欺诈风险是必须解决的问题。Airbnb信任和安全小组通过构建机器学习模型进行欺诈预测,本文介绍了其设计思想。假想模型是预测某些虚拟人物是否为“反面人...

  • 2017-05-20
  • 1139 Views
  • 未分类
  • joe

统计新浪微博各类表情使用频率

利用新浪微博API积累了微博广场的1.4万条数据并将其保存为TXT文件,然后利用python处理文件来统计表情的内容,并做相关的统计。 1. API下载微博广场数据 步骤思路:初始化API的Weibo类,设置Token后,设置下载间隔...

  • 2017-05-02
  • 3495 Views
  • 未分类
  • joe

经典:编程面试的 10 大算法概念汇总

以下是在编程面试中排名前 10 的算法相关的概念,我会通过一些简单的例子来阐述这些概念。由于完全掌握这些概念需要更多的努力,因此这份列表只是作为一个介绍。本文将从Java的角度看问题,包含下面的这些概念: 1. 字符串 2. 链表 3....

  • 2017-04-24
  • 3232 Views
  • 未分类
  • joe