Adaboost模型公式的参数推导_adaboost加权公式-程序员宅基地

技术标签: 机器学习  

  假设最后根据各个基模型 G i ( x ) i ∈ [ 1 , m ] G_i(x) {i\in[1,m]} Gi(x)i[1,m],各个基模型重要程度为 α i \alpha_i αi加权得到的模型为 f m ( x ) f_m(x) fm(x),其中 y ∈ { − 1 , 1 } y\in{\{-1,1\}} y{ 1,1}

f m ( x ) = ∑ i = 1 m α i G i ( x ) f_m(x) = \sum_{i = 1}^{m}\alpha_{i} G_i(x) fm(x)=i=1mαiGi(x)
f m ( x ) = ∑ i = 1 m − 1 α i G i ( x ) + α m G m ( x ) f_m(x) = \sum_{i=1}^{m-1}\alpha_{i} G_i(x)+\alpha_m G_m(x) fm(x)=i=1m1αiGi(x)+αmGm(x)
f m ( x ) = f m − 1 ( x ) + α m G m ( x ) f_m(x) = f_{m-1}(x) +\alpha_m G_m(x) fm(x)=fm1(x)+αmGm(x)

  基学习器的损失函数为 L ( y , f ( x ) ) = e − y f ( x ) L(y,f(x)) = e^{-yf(x)} L(y,f(x))=eyf(x)

  所以整个Adaboost模型的损失函数为:
L = ∑ i = 1 n e x p ( − y i f ( x i ) ) L = \sum_{i =1}^{n}{exp{(-y_if(x_i))}} L=i=1nexp(yif(xi))

  该损失函数的 α m \alpha_m αm G m ( x ) G_m(x) Gm(x)是需要求得的

( α m , G m ( x ) ) = a r g m i n α m , G m ∑ i = 1 n e x p ( − y i ( f m − 1 ( x i ) + α m G m ( x i ) ) ) (\alpha_m,G_m(x))= \mathop{argmin}\limits_{\alpha_m,G_m} \sum_{i=1}^{n}exp{(-y_i(f_{m-_1} (x_i)+\alpha_m G_m(x_i)))} (αm,Gm(x))=αm,Gmargmini=1nexp(yi(fm1(xi)+αmGm(xi)))

其中 ∑ i = 1 n e x p ( − y i ( f m − 1 ( x i ) + α m G m ( x i ) ) = ∑ i = 1 n e x p ( − y i f m − 1 ( x i ) ) e x p ( − y i α m G m ( x i ) ) \sum_{i=1}^{n}exp(-y_i(f_{m-1}(x_i)+\alpha_m G_m(x_i))=\sum_{i=1}^{n}exp(-y_if_{m-1}(x_i))exp(-y_i\alpha_m G_m(x_i)) i=1nexp(yi(fm1(xi)+αmGm(xi))=i=1nexp(yifm1(xi))exp(yiαmGm(xi))–(1)

  设 ω i m = e x p ( − y i f m − 1 ( x i ) ) \omega_i^{m} = exp(-y_if_{m-1}(x_i)) ωim=exp(yifm1(xi)),将其带入式(1)得到:

∑ i = 1 n ω i m e x p ( − y i α m G m ( x i ) ) \sum\limits_{i=1}^{n}\omega_ i^ {m} exp(-y_i\alpha_mG_m(x_i)) i=1nωimexp(yiαmGm(xi))–(2)

  当 y i = G m ( x i ) y_i=G_m(x_i) yi=Gm(xi)时, y i G m ( x i ) = 1 y_iG_m(x_i) = 1 yiGm(xi)=1,当 y i ≠ G m ( x i ) y_i\neq G_m(x_i) yi=Gm(xi)时, y i G m ( x i ) = − 1 y_iG_m(x_i) = -1 yiGm(xi)=1,所以式(2)可以写成

   ∑ y i = G m ( x i ) n ω i m e x p ( − α m ) + ∑ y i ≠ G m ( x i ) n ω i m e x p ( α m ) \sum\limits_{y_i=G_m(x_i)}^{n}\omega_{i}^{m}exp(-\alpha_m)+\sum\limits_{y_i \neq G_m(x_i)}^{n}\omega_{i}^{m} exp(\alpha_m) yi=Gm(xi)nωimexp(αm)+yi=Gm(xi)nωimexp(αm)

   = ∑ y i = G m ( x i ) n ω i m e x p ( − α m ) + ∑ y i ≠ G m ( x i ) n ω i m e x p ( α m ) + ∑ y i ≠ G m ( x i ) n ω i m e x p ( − α m ) − ∑ y i ≠ G m ( x i ) n ω i m e x p ( − α m ) =\sum\limits_{y_i=G_m(x_i)}^{n}\omega_{i}^{m}exp(-\alpha_m)+\sum\limits_{y_i \neq G_m(x_i)}^{n} \omega_{i}^{m}exp(\alpha_m) +\sum\limits_{y_i \neq G_m(x_i)}^{n} \omega_{i}^{m}exp(-\alpha_m) -\sum\limits_{y_i \neq G_m(x_i)}^{n} \omega_{i}^{m}exp(-\alpha_m) =yi=Gm(xi)nωimexp(αm)+yi=Gm(xi)nωimexp(αm)+yi=Gm(xi)nωimexp(αm)yi=Gm(xi)nωimexp(αm)

   = e − α m ∑ i = 1 n ω i m − ( e − α m − e α m ) ∑ y i ≠ G m ( x i ) n ω i m =e^{-\alpha_m}\sum_{i=1}^{n}\omega_{i}^{m}-(e^{-\alpha_m}-e^{\alpha_m})\sum\limits_{y_i\neq G_m(x_i)}^{n}\omega_{i}^{m} =eαmi=1nωim(eαmeαm)yi=Gm(xi)nωim

   = e − α m ∑ i = 1 n ω i m − ( e − α m − e α m ) ∑ i = 1 n ω i m I ( y i ≠ G m ( x i ) ) =e^{-\alpha_m}\sum\limits_{i=1}^{n}{\omega_{i}^{m}}-(e^{-\alpha_m}-e^{\alpha_m})\sum\limits_{i=1}^{n} {\omega_{i}^{m}I(y_i \neq G_m(x_i))} =eαmi=1nωim(eαmeαm)i=1nωimI(yi=Gm(xi))–(3)

  要使式(3)最小,则 G m ( x ) G_m(x) Gm(x)应该取 a r g m i n G ∑ i = 1 n ω i m I ( y i ≠ G m ( x i ) ) \mathop{argmin}\limits_{G}\sum\limits_{i=1}^{n}\omega_{i}^{m}I(y_i \neq G_m(x_i)) Gargmini=1nωimI(yi=Gm(xi))

  因为每次求每个点的重要程度时都会除以总和,所以 ∑ i = 1 n ω i m = 1 \sum\limits_{i=1}^{n}{\omega_{i}^{m}}=1 i=1nωim=1,对式(3)中的 α m \alpha_m αm求导得到:

   − e − α m − ( − e − α m − e α m ) ∑ i = 1 n ω i n I ( y i ≠ G m ( x i ) ) = 0 -e^{-\alpha_m}-(-e^{-\alpha_m}-e^{\alpha_m})\sum\limits_{i=1}^{n}\omega_{i}^{n}I(y_i \neq G_m(x_i)) = 0 eαm(eαmeαm)i=1nωinI(yi=Gm(xi))=0

   e − α m ( 1 − ∑ i = 1 n ω i n I ( y i ≠ G m ( x i ) ) ) = e α m ∑ i = 1 n I ( y i ≠ G m ( x i ) ) e^{-\alpha_m}(1-\sum\limits_{i=1}^{n}{\omega_{i}^{n}I(y_i\neq G_m(x_i))})= e^{\alpha_m}\sum\limits_{i=1}^{n}I(y_i \neq G_m(x_i)) eαm(1i=1nωinI(yi=Gm(xi)))=eαmi=1nI(yi=Gm(xi))–(4)

  令 ∑ i = 1 n ω i = 1 n I ( y i ≠ G m ( x i ) ) = e m \sum\limits_{i=1}^{n}\omega_{i=1}^{n}I(y_i \neq G_m(x_i))= e_m i=1nωi=1nI(yi=Gm(xi))=em

  化简式(4)得到 α m = 1 2 l n ( 1 − e m e m ) \alpha_m = \frac{1}{2}ln(\frac{1-e_m}{e_m}) αm=21ln(em1em)

  因为 ω i m = e x p ( − y i f m − 1 ( x i ) ) \omega_i^{m} = exp(-y_if_{m-1}(x_i)) ωim=exp(yifm1(xi))可以推导得

ω i m + 1 = e x p ( − y i f m ( x i ) ) = e x p ( − y i ( f m − 1 ( x i ) + α m G m ( x i ) ) ) = e x p ( − y i f m − 1 ) e x p ( − y i α m G m ( x i ) ) \omega_i^{m+1} = exp(-y_if_{m}(x_i))=exp(-y_i(f_{m-1}(x_i)+\alpha_m G_m(x_i)))=exp(-y_if_{m-1})exp(-y_i \alpha_m G_m(x_i)) ωim+1=exp(yifm(xi))=exp(yi(fm1(xi)+αmGm(xi)))=exp(yifm1)exp(yiαmGm(xi))

= ω i m e x p ( − y i α m G m ( x i ) ) =\omega_{i}^{m}exp(-y_i\alpha_m G_m(x_i)) =ωimexp(yiαmGm(xi))

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/icodeblocks/article/details/109756475

智能推荐

【CSDN精选】基于龙芯1B200的rt-thread基础_龙芯1b200参数-程序员宅基地

文章浏览阅读927次,点赞15次,收藏13次。龙芯是中国的一款自主设计的处理器架构,由中国科学院计算技术研究所(ICT)主导研发。龙芯处理器最早的版本为Loongson-1,其后发展出Loongson-2、Loongson-3等系列。这些处理器主要用于高性能计算、服务器、嵌入式系统等领域。Loongson架构具有独立知识产权,是中国自主研发的一种指令集架构。龙芯的设计旨在实现对计算机体系结构的自主掌握,减少对外部知识产权的依赖。RT-Thread(Real-Time Thread)是一个开源的实时嵌入式操作系统。_龙芯1b200参数

Python函数知识点(详解)-程序员宅基地

文章浏览阅读6w次,点赞584次,收藏2.9k次。本篇总结了Python函数相关的基础知识点,代码案例超详细,欢迎阅读,交流!_python函数知识点

虚拟机如何在net模式下进行联网_虚拟机net网络-程序员宅基地

文章浏览阅读1.7k次,点赞3次,收藏7次。虚拟机如何在net模式下进行联网(centos7)1.首先你需要先将虚拟机安装好,如果不会可以参考[centos7安装教程](https://blog.csdn.net/qq_44714603/article/details/88829423?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161949204316780274178621%2522%252C%2522scm%2522%253A%252220140713.130102334…_虚拟机net网络

python中的range()函数_python range函数-程序员宅基地

文章浏览阅读6.5w次,点赞59次,收藏241次。range()函数:用于生成一个整数序列;range()的三种创建方式:第一种:只有一个参数(小括号中只给了一个数)即range(stop)例如:range(10)指的是默认从0开始,步长为1,不包括10;注意:的运行结果为:;要想输出0-9的数字序列则应该是的结果为;第二种:range(start,stop) (给了两个参数,即小括号中给了两个数)r=range(1,10) print(list(r)) 运行结果为:;第三种:range(start,stop,step):._python range函数

数据的四种基本存储方法_数据存储-程序员宅基地

文章浏览阅读2.5k次。数据的四种基本存储方法,(1)顺序存储方法(2)链接存储方法(3)索引存储方法(4)散列存储方法_数据存储

Mysql启用SSL以及JDBC连接Mysql配置_jdbc mysql ssl-程序员宅基地

文章浏览阅读6.7k次。一、Mysql启用SSL配置1.检查mysql是否支持ssl在linux端用root账号进入mysql命令行界面,查看当前版本mysql数据库是否支持ssl,如果出现以下结果表示支持,如果没有考虑更换版本,或者编译一个带有SSL版本的mysqlshell>show variables like ‘%ssl%’;2.设置用户是否使用ssl连接1.查看用户是否使用SSL连接she..._jdbc mysql ssl

随便推点

强化学习在制造业领域的应用:智能制造的未来-程序员宅基地

文章浏览阅读223次,点赞3次,收藏5次。1.背景介绍制造业是国家经济发展的重要引擎,其产能和质量对于国家经济的稳定和发展具有重要意义。随着工业技术的不断发展,制造业的生产方式也不断发生变化。传统的制造业通常依赖于人工操作和手工艺,这种方式的缺点是低效率、低产量和不稳定的质量。随着信息化、智能化和网络化等新技术的出现,制造业开始向智能制造迈出了第一步。智能制造的核心是通过大数据、人工智能、计算机视觉等技术,实现制造过程的智能化、自动化...

ansible--安装与使用_pip安装ansible-程序员宅基地

文章浏览阅读938次。系列文章目录文章目录系列文章目录 前言 一、ansible是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言菜鸟一只,刚开始使用,仅作以后参考使用。边学习,边记录,介绍一下最基础的使用,可能会有理解不到位的地方,可以共同交流,废话不多说,走起。一、ansible 简介?ansible是自动化运维工具的一种,基于Python开发,可以实现批量系统配置,批量程序部署,批量运行命令,ansible是基于模块工作的,它本身没有批量部署的能力,真正.._pip安装ansible

RPMs系列卟啉框架材料ZnMn-RPM/AZn-RPM/FeZn-RPM/ZnPO-MOF齐岳供应金属-四羧基苯基卟啉(M-TCPPs)及三维框架卟啉材料[Cu(TPyP)Cu2Mo3O1]_fezn-5是什么意思-程序员宅基地

文章浏览阅读298次。RPMs系列卟啉框架材料ZnMn-RPM/AZn-RPM/FeZn-RPM/ZnPO-MOF齐岳供应金属-四羧基苯基卟啉(M-TCPPs)及三维框架卟啉材料[Cu(TPyP)Cu2Mo3O1]_fezn-5是什么意思

51单片机与ESP8266-01s模块通讯点灯_51单片机与eps826601s通信-程序员宅基地

文章浏览阅读9.9k次,点赞10次,收藏92次。前言 本文章为方便新手上手直接用最简单的点灯展示,关于ESP8266-01s的AT指令类就上网搜有很多这就不多讲了。接线ESP-01S USB转TTL 51单片机 VCC 3.3V 3.3V GND GND GND EN 3.3V 3.3V TX RX P3.0 RX TX P3.1 IO0(注刷固件时插) GND(注刷固件时插) 一、ESP8266-01S接US..._51单片机与eps826601s通信

麒麟820也迎来鸿蒙系统,魅族适配麒麟820系统 和鸿蒙OS,魅族要入赘华为系-程序员宅基地

文章浏览阅读188次。蜗居在珠海的小厂魅族,虽然是“小厂”,但是其一路走来的历史,一直被科技圈津津乐道,而深入简出的带头大哥黄章,更是魅友的精神领袖。魅族是一个很低调的企业,但是却有这样一种魅力,总能有意无意的成为新闻的主角,比如近日知名科技大V中国IT杂谈发布了这样一条微博:魅族正在适配麒麟820和鸿蒙系统,未来还要加入华为系。关于这条信息的真实性后面再说,我们先来讨论下华为和魅族是否真的可以成为CP,共同走向人生巅..._鸿蒙420支持麒麟820吗