_无师自通_机器学习方法的核心算法分析
ISSN1009-3044第7卷第年4月)10期(2011电脑知识与技术ComputerKnowledgeandTechnologyVol.7,No.10,April2011,pp.2335-2338
E-mail:xsjl@http://www.51wendang.com
电脑知识与技术ComputerKnowledgeandTechnologyhttp://www.51wendang.com
Tel:+86-551-56909635690964
“无师自通”机器学习方法的核心算法分析
周欣
(中央财经大学信息学院,北京100081)
摘要:机器学习的发展趋势,就是不断地使用易获得的、
廉价的数据作为样本数据
,来辅助训练数据进行学习。“无师自通”学习是迁移学习的一种改进,它使用未标记的数据集作为样本数据集,且并不假设未标记数据集和标记数据集有着同样的数据分布,它运用稀疏编码方法来对未标记数据集得到一个更高层次的表示。然后,再使用经典的监督学习方法如SVM方法来对得到的新的数据集进行机器学习。该文将介绍“无师自通”学习法的主要原理,并对其核心算法—稀疏编码算法进行深入分析并通过实验给出具体的实例。
关键词:机器学习;无师自通;未标记数据集;稀疏编码;监督学习中图分类号:TP18
文献标识码:A
文章编号:1009-3044(2011)10-2335-04
TheCoreAlgorithmof"Self-taughtLearninig"ZHOUXin
(SchoolofInformation,CentralUniversityofFinanceandEconomics,Beijing100081,China)
Abstract:Thetrendofmachinelearningistogeteasy-obtained、cheapdataassampledata,andassisttrainingdatatodomachinelearn-ing.'Self-taughtLearning'isanimprovementontransferlearning,itusesunlabeleddataassampledata,anditdoesnotassumetheunla-beleddatafollowsthesameclasslabelsorgenerativedistributionasthelabeleddata,itusessparsecodingtoconstructhigher-levelfeatures,
thenusesclassicalsupervisedlearningmethodsuchasSVMtodomachinelearningonthenewlydata.Inthispaper,Iwillintroducethebasicprincipleof“Self-taughtLearning”,andanalysethecorealgorithm-sparsecoding,finallygiveanexamplebyanexperiment.Keywords:machinelearning;self-taughtlearning;unlabeleddataset;sparsecoding;supervisedlearning
“无师自通”学习方法是一种新的机器学习框架,它最早是由斯坦福大学的几位研究人员在2007年的国际机器学习会议上提出的。它不同于传统的监督学习、无监督学习和增强学习(或者称为基于评价的学习),该方法通过从未标记数据样本中学习到一个紧凑的、有效的表示,然后将学习到的特征表示方法应用到监督学习任务中。“无师自通”学习方法不仅利用到了标记数据,也用到了未标记数据,所以它既不是监督学习,也不是非监督学习,而是一种半监督学习。
“无师自通”学习方法为机器学习提供了多样的选择性,他对于标记样本以及源领域与目标领域的限制较小,具有很强的可迁移性。我们可以运用它,从事信息处理中的分类任务。它不仅适用于文本信息的分类,也适用于对电影,录音,图象等其他非文本数据的分类。
1基本框架
图1为“无师自通”学习方法的基本框架。
2核心算法-稀疏编码
2.1来源
,生物学实验表明,视皮层对外界刺激的处理采用神经稀疏表示原则。
稀疏编码目前被假设为是一种对多维数据进行线性分解的表示方法。假设输入数据
X=(x1,x2,…,xn)T为n维随机向量,用S=(s1,s2,…,sm)T表示线性转换后的m维随机向量,那么线性转换矩阵为m×n维,记为M.线性转换表达式为:S=MX.S为转换后的稀疏分量,满足稀疏分布的要求,且向量S尽可能地相互独立.”稀疏性”是指随机向量的大部分元素为0,仅有少数神经元是活动的.稀疏分布有较低的熵值.可以减少分量之间的相关性。2.2稀疏编码在“无师自通”学习法中的应用
在“无师自通”学习方法中,我们使用稀疏编码来求未标记数据集的基元和最优系数。
2.3稀疏编码的实现方案
图1“无师自通”学习方法的基本框架
收稿日期:2011-01-25
作者简介:周欣(1982-),男,硕士,主要研究方向为数据库,数据挖掘,商务智能。
本栏目责任编辑:谢媛媛
软件设计开发
2335
【论文】“无师自通”机器学习方法的核心算法分析
“无师自通”机器学习方法的核心算法分析 机器学习的发展趋势,就是不断地使用易获得的、廉价的数据作为样本数据,来辅助训练数据进行学习。“无师自通”学习是迁移学...
机器学习十大算法的每个算法的核心思想、工作原理、适...
机器学习十大算法的每个算法的核心思想、工作原理、适用情况及优缺点_互联网_IT/计算机_专业资料。机器学习十大算法的每个算法的核心思想、工作原理、适用情况及优缺点...
机器学习十大算法的每个算法的核心思想、工作原理、适...
5-1 简述机器学习十大算法的每个算法的核心思想、工作原理、适用情况及优缺点等...3)朴素贝叶斯算法: 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。...
机器学习的方法
机器学习的方法_计算机硬件及网络_IT/计算机_专业资料...从数据分 析的角度来说,用机器学习进行数据分析(...随后,以支撑矢量机为核心算法的核机器(KM) 方法和...
模式识别期末论文最终版
文中重要分析了机器学习方法的核心思想及训 练算法,还有其具体应用。 关键字:...(即对特 定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间...
支持向量机回归方法在实时业务预报中的应用
地面气压的 0小时分析场资料构造预报因子, 建立德阳...近年发展起来 的一种机器学习方法 支持 向量机(...S M方法的核心概念是支持向量。如V 图1 所示, ...
浅谈机器学习方法_甄盼好
接着,着重介绍了流形学习、李群机器学习和核机器学习三种新型的机器学习方法,为...随后,以支撑矢量机为核心算法的核机器(KM) 方法和 Fisher 判断分析(FDA)方法...
数据挖掘学习报告
1.C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是 ID3 算法。 ...因此在学习时,除 了要对基本概念和方法正确理解外,必须具体问题具体分析处理,以...
[数据挖掘] 数据开采与知识发现综述
3.数据清理和预处理:去除噪声或无关数据,去除空白...聚类方法包括统计分析方法,机器学习方法,神经网络方法...AQ 系列的核心算法是在正例集中任选一个种子,它到...
支持向量机组合核函数研究本科毕业论文
其次,具体分析高斯核函数,讨论其可分性和局部性,接着分析 sigmoid 核函数的可 ...核函数方法是以支持向量机为核心算法的一类新的机器学习方法,作为其重要组成部 ...
- 大学物理实验教学体系构建的探索-2019年文档
- 2016届高考生物一轮课堂复习学案:26《神经调节》
- 设计招标评分标准
- 人材机消耗及单价表
- 颅脑断面解剖
- 冯骥才介绍
- 2015届18美国内战
- 颈椎病的诊断和治疗原则
- 爱是一件温暖的衣裳
- Formal business letter
- 英语口语中礼貌用语
- 锂电池电极制造
- 2010年春节手机促销活动方案
- 中国烟草价格表 价目表 香烟零售价
- 火电厂脱硫脱硝技术概述
- 机器学习十大算法
- 学习发展
- 学习方法
- 股票交易
- 机器学习数据
- 数据挖掘技术
- 财务预警模型
- 机器学习综述
- 机器学习十大算法8:kNN11页
- 机器学习十大算法的每个算法的核心思想、工作原理、适用情况及优缺点7页
- 机器学习十大算法:CART23页
- 机器学习十大算法:朴素贝叶斯15页
- 机器学习十大算法:AdaBoost23页
- 机器学习十大算法:PageRank9页
- 人类学习能力的发展规律3页
- 个人学习发展计划8页
- MU岗位员工学习发展图1页
- HS服务组学习发展图6页
- 在企业学习与发展1页
- 学习发展观心得3页
- 英语学习方法总结2页
- ccc学习方法1页
- 掌握科学的学习方法10页
- 高三文科科学学习方法[1]10页
- 科学的学习方法ppt28页
- 掌握科学学习方法28页
- 股票交易系统需求分析19页
- 股票交易实验报告11页
- 股票交易手续费2页
- 股票如何交易1页
- 关于股票网上交易流程2页
- 股票入门之交易指南12页
- 机器学习算法的网络大数据级应用实践_许春玲7页
- 统计机器学习方法假设所有数据都是具有相同结构的实体,数据之间是5页
- 机器学习&数据挖掘笔记_25(PGM练习九:HMM用于分类)10页
- 计算机学报》机器学习与数据挖掘专辑1页
- 机器学习与数据挖掘国际会议通知1页
- 机器学习与数据挖掘14页
- Web数据挖掘技术在电子商务中的应用研究3页
- 基于数据挖掘技术的高校实验室设备采购决策支持系统6页
- 数据挖掘概念与技术38页
- 浅谈数据挖掘技术在交叉销售中的应用_杨志刚1页
- 基于数据挖掘技术的交叉销售模型设计_周梅2页
- 医学数据挖掘的技术_方法及应用_朱凌云7页