小简铺子


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

决策树相关算法——XGBoost原理分析及实例实现(一)

发表于 2018-04-26 | 分类于 ML&DL | Views:
| 字数统计: 2,222 | 阅读时长 ≈ 8 分钟

1.前言

本篇博客主要叙述的是提升方法中的XGBoost,而XGBoost本身包含的技术点及算法优化太多,且网上已经有很多原理性的相关介绍了,但是笔者还是希望自己亲身走一遍XGBoost的原理理解过程,以此来更熟练的使用XGBoost。话不多说,此篇主要叙述基于CART决策树的XGBoost的代价函数的优化过程(即该模型的参数求解过程)。

阅读全文 »

决策树相关算法——Boosting之Adaboost&GBDT详细分析与实现

发表于 2018-04-12 | 分类于 ML&DL | Views:
| 字数统计: 4,360 | 阅读时长 ≈ 17 分钟

前言
本篇博客主要记录的是集成学习中的Boosting提升算法的相关实现,主要分为以下四个部分,Boosting的提出,Boosting经典算法Adaboost的分析与实现,Adaboost算法的特例提升树的分析,梯度提升算法GBDT的提出原因及分析。

阅读全文 »

Hexo+Coding+Github部署个人博客Error全集

发表于 2018-04-10 | 分类于 问题集 | Views:
| 字数统计: 2,191 | 阅读时长 ≈ 9 分钟
前言

终于历经两天把我的Hexo+Coding+Github双部署个人博客网站给搭建好了,并将之前的博客进行了转移,期间真是历经磨难,泪崩了简直要。各种各样的问题,网上有些百度的到,但也有一些百度不到的,或者说讲述的比较模糊的,我在这将所有遇到的困难和解决方法都记录了下来。

阅读全文 »

自我修养一

发表于 2018-04-07 | 分类于 程序人生 | Views:
| 字数统计: 1,536 | 阅读时长 ≈ 5 分钟

前言

都说清明时节雨纷纷,然而今天的广州却没有下一丝细雨,一个人坐在实验室中时不时能感受到窗外微风拂过带来的凉爽。听着歌,码着代码,突然感慨万千,想着记录一下吧,毕竟此时此刻此想不常有。

阅读全文 »

决策树相关算法——Bagging之基于CART的随机森林详细说明与实现

发表于 2018-04-05 | 分类于 ML&DL | Views:
| 字数统计: 3,565 | 阅读时长 ≈ 14 分钟

1 前言

1.1 本篇博客主要记录的是基于CART决策树实现的随机森林算法,主要是从以下四个方面介绍: CART决策树的构建思想;集成学习中的Bagging思想;基于CART决策树的随机森林代码实现;随机森林不易过拟合的分析。(其中不易过拟合并不是说随机森林不会过拟合)
1.2 本篇博客之前的一篇博客决策树相关算法——ID3、C4.5的详细说明及实现详细的记录了决策树的思想,概念及相关公式的详解,此篇博客便不做雷同叙述。

阅读全文 »

决策树相关算法——ID3、C4.5的详细说明及实现

发表于 2018-04-02 | 分类于 ML&DL | Views:
| 字数统计: 4,360 | 阅读时长 ≈ 18 分钟

前言

本篇博客记录的是使用python实现两个个决策树相关的算法模型—— ID3、C4.5。其中训练模型使用的数据集是Adult。尽管Sklearn包中都有这些算法的实现,但是自身根据算法思路实现一遍也是美滋滋的,其中酸甜自知(话说可以提高一定的代码编写能力和调试程序的能力),GitHub详细代码实现地址。

阅读全文 »

卷积神经网络(TextCNN)在句子分类上的实现

发表于 2018-03-16 | 分类于 NLP | Views:
| 字数统计: 3,443 | 阅读时长 ≈ 16 分钟

说明

本篇博客记录的是论文Convolutional Neural Networks for Sentence Classification中的实验实现过程,一篇介绍使用CNN对句子进行分类的论文。尽管网上有些代码已经实现了使用CNN进行句子分类(TextCNN),但是是基于Theano来实现的,本文将介绍使用TensorFlow来实现整个论文的实验过程,一方面熟悉使用TensorFlow API,另一方面加深自己对CNN在NLP上的应用的理解。
实例的Github地址

阅读全文 »

TensorFlow实现多层感知机及可视化训练过程中的数据记录

发表于 2018-03-02 | 分类于 ML&DL | Views:
| 字数统计: 2,367 | 阅读时长 ≈ 10 分钟

说明(what)

本篇博客主要有2个目的,第一,记录学习使用TensorFlow的操作流程;第二,将TensorFlow训练数据模型过程中的参数数据进行可视化记录。

阅读全文 »

Java并发编程基础(二)

发表于 2017-12-31 | 分类于 java并发 | Views:
| 字数统计: 1,710 | 阅读时长 ≈ 6 分钟

前言

熬过了考试周,终于可以继续我的博客分享了。大笑,哈哈,装个X。
本篇博客主要记录的是自己使用线程间通信的过程。

阅读全文 »

Centos7在虚拟机中扩展磁盘空间

发表于 2017-12-25 | 分类于 问题集 | Views:
| 字数统计: 364 | 阅读时长 ≈ 1 分钟

说明

情况:已经在VirtualBox虚拟机创建了一个磁盘并已经装好了系统,发现磁盘空间太小,需要再添加一个磁盘的大小。或者说Centos7系统需要扩展磁盘空间。

阅读全文 »
1234
ComeOnJian

ComeOnJian

生活不能等待别人来安排,要自己去争取与奋斗!

32 日志
8 分类
30 标签
GitHub CSDN
Links
  • 翔工作室
  • Hosted by Coding Pages
  • 联系我 1343483119@qq.com
© 2017 — 2019 ComeOnJian
网站访问量次 博客全站共90.9k字