第七章 机器学习
7.1 机器学习的定义、研究意义与发展历史
7.2 机器学习的主要策略与基本结构
7.3 –7.7 几种常用的学习方法
7.8 知识发现
7.9 小结
2
7.1 机器学习的定义和发展历史
7.1.1 机器学习的定义
?机器学习的定义
顾名思义,机器学习是研究如何使用机器来
模拟人类学习活动的一门学科。稍为严格
的提法是:机器学习是一门研究机器获取
新知识和新技 能,并识别现有知识的学问。
3
7.1.2 机器学习的发展史
?机器学习的发展分为 4个时期
?第一阶段是在 50年代中叶到 60年代中叶,
属于热烈时期。
?第二阶段在 60年代中叶至 70年代中叶,被
称为机器学习的冷静时期。
?第三阶段从 70年代中叶至 80年代中叶,称
为复兴时期。
?机器学习的最新阶段始于 1986年 。
7.1 机器学习的定义和发展历史
4
?机器学习进入新阶段的表现
?机器学习 已成为新的边缘学科并在高校形
成课程。
?综合各种学习方法
?机器学习与人工智能问题 的统一性观点正
在形成。
?各种学习方法的应用范围不断扩大。
?数据挖掘和知识发现 的研究已形成热潮 。
?与机器学习有关的学术活动空前活跃 。
7.1 机器学习的定义和发展历史
5
7,2 机器学习的主要策略和基本结构
7.2.1 机器学习的主要策略
按照学习中使用推理的多少,机器学习所采
用的策略大体上可分为 4种 ———机械学习, 通
过传授学习, 类比学习 和 通过事例学习。
?机械学习
?传授学习策略
?类比学习系统
?通过 事例学习策略
6
7.2.2 机器学习系统的基本结构
1.学习系统的基本结构
环 境 学 习 知识库 执 行
图 6.1 学习系统的基本结构
7.2 机器学习的主要策略和基本结构
7
2.影响学习系统设计的要素
? 影响学习系统设计的最重要因素
是环境向系统提供的信息,或者
更具体地说是信息的质量。
? 知识库是影响学习系统设计的第
二个因素。 知识的表示有特征向
量、一阶逻辑语句、产生式规则、
语义网络和框架等多种形式。
7.2 机器学习的主要策略和基本结构
8
7.3 机械学习
1.机械学习模式
机器学习是最简单的学习方法。机器学习
就是记忆,即把新的知识存储起来,供需要时
检索调用,而不需要计算和推理。它是一种最
基本的学习过程。
7.3 机械学习
9
存储 计算 推导 归纳
算法与理论
机械记忆 搜索规则
图 7.2 数据化简级别图
Lenat,Hayes-Roth,和 Klahr等人于 1979年
关于机械学习提出一种有趣的观点,见图 6.2。
7.3 机械学习
10
2.机械学习的主要问题
?存储组织信息, 要采用适当的存储方式,
使检索速度尽可能地快。
?环境的稳定性与存储信息的适用性问题,
机械学习系统必须保证所保存的信息适
应于外界环境变化的需要。
?存储与计算之间的权衡,对于机 械学习
来说很重要的一点是它不能降低系统的
效率。
7.3 机械学习
11
7.4 归纳学习
?归纳学习( induction learning)是应用归纳推理进
行学习的一种方法。根据归纳学习有无教师指导,
可把它分为示例学习和观察与发现学习。
7.4.1 归纳学习的模式和规则
? 归纳学习的模式
解释过程
实例空间 规则空间规划过程
12
7.5 类比学习
7.5.1 类比推理和类比学习方式
类比学习( learning by analogy)就是通
过类比,即通过对相似事物加以比较所
进行的一种学习 。
其推理过程如下,
回忆与联想 --- 选择 --- 建立对应关系
---转换
13
7.5.2 类比学习过程与研究类型
? 类比学习主要包括如下四个过程:
1,输入一组已知条件和一组未完全确
定的条件 。
2,对两组出入条件寻找其可类比的对
应关系。
3,根据相似转换的方法,进行映射。
4,对类推得到的知识进行校验。
7.5 类比学习
14
?类比学习的研究可分为两大类,
(1) 问题求解型的类比学习
(2) 预测推定型的类比学习。它又分为
两种方式,
一是传统的类比法
另一是因果关系型的类比
7.5 类比学习
15
7.6 解释学习
7.6.1 解释学习过程和算法
1986年米切尔( Mitchell)等人为基于
解释的学习提出了一个统一的算法 EBG:
训练例子
操作准则
知识库
新规则目标概念
16
EBG求解问题的形式可描述于下,
给定:
(1) 目标概念描述 TC;
(2) 训练实例 TE;
(3) 领域知识 DT;
(4) 操作准则 OC。
求解:
训练实例的一般化概括, 使之满足:
(1) 目标概念的充分概括描述 TC;
(2) 操作准则 OC。
7.6 解释学习
17
7.7 神经学习
7.7.1 基于反向传播网络的学习
反向传播 ( back-propagation,BP)算法
是一种计算单个权值变化引起网络性能
变化值的较为简单的方法。 BP算法过程
包含从输出节点开始,反向地向第一隐
含层传播由总误差引起的权值修正。
18
7.7.2 基于 Hopfield网络的学习
反馈神经网络,它是一种动态反
馈系统,比前馈网络具有更强的计
算能力。
Hopfield网络是一种具有正反相
输出的带反馈人工神经元。
7.7 神经学习
19
7.8 知识发现
7.8.1 知识发现的发展和定义
?知识发现的产生和发展
知识发现最早是于 1989年 8月在第 11届国际
人工智能联合会议的专题讨论会上提出。
?知识发现的定义
数据库中的知识发现是从大量数 据中辨识
出有效的, 新颖的, 潜在有用的, 并可被
理解的 模式的高级处理过程 。
20
7.8.2 知识发现的处理过程
1,数据选择 。根据用户的需求从数据
库中提取与 KDD相关的数据。
2,数据预处理 。主要是对上述数据进
行再加工,检查数据的完整性及数据
的一致性,对丢失的数据利用统计方
法进行填补,形成发掘数据库。
7.8 知识发现
21
3,数据变换 。即从发掘数据库里选择
数据
4.数据挖掘 。根据用户要求,确定 KDD
的目标是发现何种类型的知识。
5,知识评价 。这一过程主要用于对所获
得的规则进行价值评定,以决定所得
的规则是否存入基础知识库。
7.8 知识发现
22
7.8.3 知识发现的方法
1.统计方法:统计方法是从事物的外在数量上
的表现去推断该事物可能的规律性。
2,机器学习方法
3,神经计算方法
4.可视化方法,可视化( visualization)
就是把数据、信息和知识转化为可视的
表示形式的过程。
7.8 知识发现
23
7.8.4 知识发现的应用
?知识发现已在许多领域得到应用。现
在,知识发现已在银行业、保险业、零
售业、医疗保健、工程和制造业、科学
研究、卫星观察和娱乐业等行业和部门
得到成功应用,为人们的科学决策提供
很大帮助。
7.8 知识发现
24
7.9 小结
本章只对机器学习作个入门介绍。
机器学习在过去十多年中获得较大发
展。今后机器学习将在理论概念、计算机
理、综合技术和推广应用等方面开展新的
研究。其中,对结构模型、计算理论、算
法和混合学习的开发尤为重要。在这些方
面,有许多事要做,有许多新问题需要人
们去解决 。