第 30章 高技术输入输出设备
30- 1 数码相机
一、数码相机的定义数码相机又称为数字相机,简称 DCS(Digital
Still Camera)。其实质是一种非胶片相机,
它采用 CCD(电荷藕合器件)或 CMOS(互补金属氧化物半导体)作为光电转换器件,
将被摄物体以数字形式记录在存储器中。
第 30章 高技术输入输出设备
二、数码相机特性数码相机是集光学、机械、电子于一体的的现代高技术产品,它集成了影像信息的转换、
存储和传输等多种部件,具有数字化存取模式、与计算机交互处理和实时拍摄的特点。
因此数码相机有如下之特性:
第 30章 高技术输入输出设备
1,立即成像:数码相机属电子取像,可立即在液晶显示器、计算机显示器或电视上显示,
可实时监视影像效果,也可随时删除不理想的图片。
2.与计算机兼容:数码相机存储器里的图像输送到计算机后通过影像处理软件,可从事剪切,编辑、打印等,并可将影像存储在计算机中。
3.电信传送:数码相机可将图像信号转换为电子信号,经电信传输网或内部网进行传输。
第 30章 高技术输入输出设备
三、数码相机的基本结构数码相机与传统的胶片相机两者最大的区别是在它们各自的内部结构和原理上。它们的共同点是均由光学镜头、取景器、对焦系统、快门、光圈、内置电子闪光灯等组成,有的数码相机既有取景器还有液晶显示器 LCD。但数码相机还有其特殊的结构,
如 CCD或 CMOS、仿真信号处理器,A/D模数转换器,DSP数字信号处理器、图像处理器、图像存储器和输出控制单元等。
第 30章 高技术输入输出设备
以下是数码相机主要部件的主要功能:
1) 镜头主要功能:把光线会聚到 CCD或 CMOS图像传感器上,起到调整焦距的作用。对于定焦数码相机,镜头、物体和聚焦平面间的理想距离被精确计算,从而固定了镜头和光圈的位置。对于 ZOOM 数码相机,有一个机械装置,可以带动镜头组前后运动,一直让镜头保持在聚焦平面中央,能够捕捉到距离镜头的远近的物体。
第 30章 高技术输入输出设备
2) CCD( CMOS)图像传感器主要功能:把镜头传来的图像信号转变为仿真电信号。
3) A/D转换器主要功能:数码相机利用 A/D转换器将
CCD产生的仿真电信号转换为数字信号,并传输到图像处理单元。 4) 数字信号处理器主要功能:数字信号处理器主要功能是通过一系列复杂的数学运算法,如加、减、乘、除、积分等,对数字图像信号进行优化处理 (包括:白平衡、彩色平衡、伽玛校正与边缘校正等 )。
第 30章 高技术输入输出设备
5) 图像压缩主要功能:数码相机的图像处理包括数据压缩,图像压缩的目的是为了节省存储空间,利用 JPEG编码器把得到的图像转换为静止压缩的图像 (JPEG格式 )。
6) 总体控制电路主要功能:主控程序芯片
(MCU)能协调和控制测光、运算、曝光、闪光控制及拍摄逻辑控制。当电源开启时,
MCU则开始距检查各功能是否正常,若正常,
相机处于准备状态。
第 30章 高技术输入输出设备
四、数码相机的工作原理数码相机在使用过程中,半按快门对准被摄的景物
(快门 ON状态,与胶片相机相反 ),从镜头传来的光图像经过光电转换器 (CCD或 CMOS) 感应将光信号转换成为一一对应的仿真信号,再经 A/D模数转换器转换,把仿真电信号变成数字信号,最后经过图像处理器 DSP(Digital Signal Processor)和主控程序芯片 (MCU)按照指定的文件格式,把图像以二进制数码的形式显示在 LCD上,如按下快门,则把图像存入存储器中。
第 30章 高技术输入输出设备
数码相机的工作步骤大致分如下:
1 开机准备:当打开相机的电源时,其内部的主控程序就开始检测各部件是否正常。如某一部件有异常,内部的蜂鸣器就会发出警报或在 LCD上提示错误信息并停止工作。如一切正常,就进入准备状态。
2 聚焦及测光:数码相机一般都有自动聚焦和测光功能。当打开 DSC电源时,相机内部的主控程序芯片 (MCU)立即进行测光运算,曝光控制和闪光控制及拍摄逻辑控制。当对准物体并把快门按下一半时,MCU开始工作,图像信号经过镜头测光( TTL测光方式)传到 CCD或 CMOS上并直接以 CCD或
CMOS输出的电压信号作为对焦信号,经过 MCU的运算、比较再进行计算、确定对焦的距离和快门速度及光圈的大小,
驱动镜头组的 AF和 AE装置进行聚焦。
第 30章 高技术输入输出设备
3 图像捕捉:在聚焦及测光完成后再按下快门,摄像器件( CCD或 CMOS)就把从被摄景物上反射的光进行捕捉并以红、绿、蓝三种像素(颜色)存储。
4 图像处理:就是把捕捉的图像进行 A/D转换、图像处理、白平衡处理、色彩较正等,再到存储区合成在一起形成一幅完整的数字图像,在图像出来后再经过 DSP单元进行压缩转换为 JPEG格式(静止图像压缩方式),以便节省空间。
第 30章 高技术输入输出设备
5图像存储:在图像处理单元压缩的图像送到存储器中进行保存。
6 图像的输出:存储在数码相机存储器的图像通过输出端口可以输出送到计算机,可在计算机里通过图像处理程序(软件)进行图形编辑、处理、打印或网上传输等。
第 30章 高技术输入输出设备
在中高级的数码相机中,一般都含有 AE功能和 AF功能
1) AE功能当 DSC相机对准被摄物体时,CCD根据镜头传来的图像亮度的强弱,转变为 CCD数字电压信号,DSP再根据 CCD数字电压信号进行运算处理,再把运算结果传输给 MCU迅速找到合适的快门速度和镜头光圈的大小最佳值,
由 MCU控制 AE机构进行自动曝光。
第 30章 高技术输入输出设备
2) AF功能直接利用 CCD输出的数字电压信号作为对焦信号,经过 MCU的运算比较进行驱动镜头 AF
机构前后运动。
五、数码相机的分类目前数码相机的分类很多,如果按图像传感器来分,可分为 CCD数码相机和 CMOS数码相机。
第 30章 高技术输入输出设备
CCD数码相机
CCD数码相机是指数码相机使用 CCD图像传感器来记录图像,属中高档相机。 CCD本身是不能分辨各种颜色的光,要用不同颜色的滤色片配合使用,因此 CCD数码相机有以下两种工作方式:
1 利用透镜和分光镜将光图像信号分成 R,G,B三种颜色,并分别作用在三片 CCD上,这三种颜色的光经 CCD转换为仿真电信号,然后经 A/D转换器转换为数字信号,再经 DSP数字信号处理器处理后存储到存储器中。
第 30章 高技术输入输出设备
2 在每个像素点的位置上有三个分别加上 R,G,B
三种颜色滤色片的 CCD,经过透镜后的光图像信号被分别作用在不同的传感器上,并将它们转换为仿真电信号,然后经 A/D转换器转换为数字信号,再经 DSP数字信号处理器处理后存储到内存中。
CMOS数码相机
CMOS数码相机是指数码相机使用 CMOS图像传感器来记录图像。其工作方式与 CCD数码相机相似,
目前属低档相机。
第 30章 高技术输入输出设备
CCD图像传感器与 CMOS图像传感器比较:
CMOS图像传感器易与 A/D电路、数字信号处理器 DSP电路等集成在一起。 CCD图像传感器只能单一的锁存到成千上万的采样点上的光线的状态,CMOS则可以完成其它的许多功能,如 A/D转换,负载信号处理、白平衡处理及相机控制 (白平衡调调整就是通过图像调整,使在各种光线条件下拍的照片色彩与人眼看到的景物色彩一样 )。
第 30章 高技术输入输出设备
另外,CMOS图像传感器还有耗电小的优点,
其耗电量约为 CCD图像传感器的 1/10。但目前 CMOS图像传感器在解析力和色彩上还不如 CCD图像传感器,图像有噪音、准确捕捉动态图像的能力还不强。
第 30章 高技术输入输出设备
六、数码相机的聚焦聚焦是清晰成像的前提,数码相机一般都有自动聚焦功能。数码相机的自动聚焦功能与传统的胶片相机类似,也有主动式和被动式两种形式。
主动式就是相机主动发射红外线(或超声波),根据目标的反射进行 聚焦。
第 30章 高技术输入输出设备
数码相机的技术缺陷快门延时:对于传统相机而言,从按下快门键至快门释放这段延迟时间是可以被忽视的。而数码相机就不行,因为有一个快门时滞的问题,也就是说你按下快门后,CCD并没有马上捕捉光线,而是过一些时间后才开始工作。不同数码相机的快门时滞是不一样的,价格低廉的数码相机反应速度比较慢。这使得数码相机在拍摄运动物体时显得力不从心,随着技术的进步,快门延滞时间将会越来越少。
第 30章 高技术输入输出设备
长时间曝光:许多数码相机经过长时间曝光后的图像质量会有所下降,具体表现是:噪点比较多,色彩还原不自然,容易出现色斑和杂色,低端数码相机在这方面更为突出。
ISO值的设置:一般来说,数码相机制造商都采用胶卷感光度的标准来对 CCD的感光度进行划分,因此一台 ISO 80
数码相机的感光度与普通相机使用 ISO 80胶卷时是相同的。
一些价格昂贵的高档数码相机 ISO设置可调节,可增大到
ISO 200,400,800。这使得摄影师们拍摄高速运动的物体或处在弱光下的景物成为可能。虽然现在已经有 ISO3200的专业数码相机,但民用级数码相机所使用的 CCD感光度还很低,一般都不会 ISO400、不低于 ISO50,如深受行业人士看好的柯达 Pro Back感光度也只 ISO100。
第 30章 高技术输入输出设备
电池的使用时间:电池使用时间太短至今仍是让数码相机使用者和制造者头痛的事,各大数码相机生产厂家都在电池研制上花了不少功夫,相信这个问题会逐渐得到解决。
此外,在数码相机与传统相机的区别方面,还值得一提的是摄影观念上的差别。不同的操作必然会造成观念上的差异,而且这个差异将直接影响到数码相机的定位和发展。
第 30章 高技术输入输出设备
全球定位系统
1.1 基本原理
GPS 系统是由美国国防部的陆海空三军在 70
年代联合研制的新型卫星导航系统它的英文名称是,Navigation Satellite Timing And
Ranging / Global Positioning System” 其意为“卫星测时测距导航全球定位系统” 简称
GPS 系统第 30章 高技术输入输出设备
GPS 的定位原理实质上就是测量学的空间测距定位,
利用在平均 20200km 高空均匀分布在 6 个轨道上的
24 颗卫星发射测距信号码和载波,用户通过接收机接收这些信号测量卫星至接收机之距,通过一系列方程演算便可知地面点位坐标。
1.2 GPS 的组成
GPS 由三部分组成 GPS 空间部分地基监控站和
GPS 用户接收机部分第 30章 高技术输入输出设备第 30章 高技术输入输出设备第 30章 高技术输入输出设备
1.2.1 GPS 空间部分
GPS 空间部分由 24 颗分布在 6 个等间隔轨道上的卫星组成,卫星分布可保证全球任何地区任何时刻都不少于 4 颗卫星供观测,24颗卫星中 3 颗做为备份每个轨道平面上有 4 颗卫星它们按与地球成 55度 的相同方向运行空间间隔约为 90度。
第 30章 高技术输入输出设备
1、空间部分由 21颗工作卫星和 3颗备用卫星。
第 30章 高技术输入输出设备第 30章 高技术输入输出设备
每个 GPS 卫星都对应一组编号它们有多种编号一般采用 PRN(卫星所采用的伪随机噪声码)编号,
GPS 定位精度高低关键在于高稳定度的频率标准,
为此每颗 GPS 卫星都设有两台铷原子钟和两台铯原子钟。
1.2.2 地基监控站地基部分
地基监控站由一个主控站和四个监控站组成,主控站设置在美国大陆,四个监控站分别设在大西洋太平洋和印度洋诉岛屿上。
Colorado springs
5
5
Hawaii
Ascencion Diego Garcia
kwajalein
1个主控站,Colorado springs(科罗拉多,斯平士 )。
3个注入站,Ascencion(阿森松群岛 ),Diego Garcia(迭哥伽西亚 )、
kwajalein(卡瓦加兰 )。
5个监控站,以上主控站、注入站及 Hawaii(夏威夷 )。
第 30章 高技术输入输出设备
1.2.3 GPS 用户接收机
用户接收机通过接收多颗卫星的信号来解算出自身的位置以实现定位和导航,GPS 接收机按使用环境可分为中低动态接收机和高动态接收机,按所收信号可分为单频 C/A 码接收机和双频 P 码和 Y码接收机。
第 30章 高技术输入输出设备手持型 GPS机 车载型 GPS
机第 30章 高技术输入输出设备单频机双频机第 30章 高技术输入输出设备
GPS 提供 2 种水平的导航服务 — 精密定位服务 PPS
和标准定位服务 SPS,PPS 主要供美国及其盟国的军用和特殊许可部门,对一般用户只能使用单频
C/A 码定位。
由于美国的 GPS 政策所定使用单频 C/A 码还要受到 SA 的影响,即为降低精度而人为加入的一些干扰。因此一般单机定位精度为二维 100 米左右,对要求高的场合则需采用 DGPS 差分工作方式,精度可提高到 10 米,军用可到毫米级。
第 30章 高技术输入输出设备
3.1 GPS 传输信号分类
被传输的信号包含 2不同的信息
第一种是频率为 10.23MHz 的军用 P 码,美国政府禁止把该码提供给民用用户。
第二种是 C/A 码频率为 1.023MHz,用户用该码可以得到基本的定位信息。
第 30章 高技术输入输出设备
一、语音识别技术简介
计算机语音识别是一个模式识别匹配的过程。在这个过程中,
计算机首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的整体模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音匹配的模板。然后,据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型和语言模型的好坏、模板是否准确等都有直接的关系。
第 30章 高技术输入输出设备语音识别是一门交叉学科。语音识别过程实际上是一种认识过程,该过程与人对语音的识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论,一个完整的语音识别系统可大致分为三部分:
( 1)语音特征提取:操作员发出的语声波先由话筒接收并转换为电信号再进入自动识别系统,经过特征分析,把言语划分成一段段具有一定时间长度的音段序列,每一个音段的特征可以经编写组合成便于存储和便于比较的图形,语音特征提取就是从语音波形中提取出随时间变化的语音特征序列。
第 30章 高技术输入输出设备
( 2)声学模型与模式匹配:声学模型通常将获取的语音特征通过学习算法产生,它是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型的目的是提供一种有效的方法,计算语音的特征矢量序列和每个发音模板之间的距离。另外,
声学模型的设计和语言发音特点密切相关,必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小,在识别时将输入的语音特征同声学模型进行匹配与比较,得到最佳的识别结果。
第 30章 高技术输入输出设备
( 3)语言模型与语言处理:语言模型包括由识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。就像人们听语音时,并不把语音和语言的语法结构、语义结构分开来,因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程,对机器来说,识别系统也要利用这些方面的知识。语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义。
第 30章 高技术输入输出设备
语音识别原理第 30章 高技术输入输出设备
Bill Gates 在 97年世界计算机博览会
(COMDEX)主题演讲会上描绘 IT事业的发展宏图时,率先指出:
下一代操作系统和应用程序的用户界面将是语音识别。工业界应对语音识别领域的重大突破做好充分准备,因为那将是一场席卷全球的另一次热潮。
1998年 11月 5日,微软中国研究院在北京成立。
该中心的任务是重点研究计算机在中文环境下的易用性。
第 30章 高技术输入输出设备
IBM公司潜心研究语音识别技术迄今已达 30年之久,投资超过 2亿美元。
IBM公司于 1995年在北京成立了中国研究中心,中文语音信息处理成了该中心三大研究领域之一,并于 1997年 9月 4日,在北京推出了中文连续语音识别产品 ViaVoice。
第 30章 高技术输入输出设备
1998年,英特尔公司也宣布致力于推广语音识别技术,除了在北京举办首届语音技术国际论坛之外,还在北京、上海、成都、广州等地展开了“基于英特尔框架的语音识别技术”的宣传活动。
联合了七家世界著名学术机构(中科院自动化所、
清华大学、香港科技大学、香港中文大学、麻省理工学院、俄勒岗研究院,WATERLLOO大学)成立了
“国际语音技术研究组织”,致力于计算机语音技术的基础研究,以加速中文语音识别技术的发展。
第 30章 高技术输入输出设备
发音的生理机构肺活量声带
(声门) 咽腔软腭鼻腔口腔气管及支气管鼻音口音主声道,声门以上,经咽喉,口腔的管道 。
鼻 道,经小舌和鼻的管道称为鼻道 。
次声门系统:经肺,气管和支气管的管道 。
第 30章 高技术输入输出设备
语音的产生过程音源产生 声道调音 向外辐射
音源:声带音源,非声带音源
-声带振动周期,T (F0=1/T:基本频率 )
声道调音:对声道形状进行调整 。
-声道共振频率:
语音分类:
-浊音:由声带振动并激励声道而得到的语音 。
-清音:由气流高速冲过某处收缩的声道所产生的语音 。
第 30章 高技术输入输出设备
·构词规则
·同音字判决
·语法语义
·背景知识预处理 声学参数 分析 测度估计失真测度语音库判决专家知识库训练识别结果
·反混叠失真滤波器
·预加重器
·端点检测
·噪声滤波器
·欧氏距离
·似然比测度
○
语音信号输入第 30章 高技术输入输出设备
训练 (Training):预先分析出语音特征参数,制作语音模板 (Template)并存放在语音参数库中。
识别 (Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,
得出识别结果。
失真测度 (Distortion Measures):在进行比较时要有个标准,这就是计量语音特征参数矢量之间的“失真测度”。
主要识别框架,基于模式匹配的动态时间规整法
(DTW:Dynamic Time Warping)和基于统计模型的隐马尔柯夫模型法 (HMM:Hidden Markov Model)。
第 30章 高技术输入输出设备
在训练阶段,将特征参数进行一定的处理后,
为每个词条建立一个模型,保存为模板库。
在识别阶段,语音信号经过相同的通道得到语音特征参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。同时,还可以在很多先验知识的帮助下,提高识别的准确率。
第 30章 高技术输入输出设备
● 语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采 集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;
另外一个 问题是对用户的错误输入不能正确响应,
使用不方便。
●高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓 Lombard效应,必须寻找新的信 号分析处理方法。
第 30章 高技术输入输出设备
● 语言学、生理学、心理学方面的研究成果已有不少,但如何把这些知识量化,建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量 连续语音识别中是非常重要的。
●我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理 等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰 难的过程。
第 30章 高技术输入输出设备
● 语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要 解决,识别速度、拒识问题以及关键词(句)检测技术(即从连续语音中去除诸如,啊”、“唉”等语音,获得真正待识别的语音部分)等等技术细节要解决。
为了解决这些问题,研究人员提出了各种各样的方法,如自适应训练,基于最 大互信息准则( MMI)
和最小区别信息准则( MDI)的区别训练和“矫正”
训练;应 用人耳对语音信号的处理特点,分析提取特征参数,应用人工神经元网络 …… 所有 这些努力都取得了一定成绩。
30- 1 数码相机
一、数码相机的定义数码相机又称为数字相机,简称 DCS(Digital
Still Camera)。其实质是一种非胶片相机,
它采用 CCD(电荷藕合器件)或 CMOS(互补金属氧化物半导体)作为光电转换器件,
将被摄物体以数字形式记录在存储器中。
第 30章 高技术输入输出设备
二、数码相机特性数码相机是集光学、机械、电子于一体的的现代高技术产品,它集成了影像信息的转换、
存储和传输等多种部件,具有数字化存取模式、与计算机交互处理和实时拍摄的特点。
因此数码相机有如下之特性:
第 30章 高技术输入输出设备
1,立即成像:数码相机属电子取像,可立即在液晶显示器、计算机显示器或电视上显示,
可实时监视影像效果,也可随时删除不理想的图片。
2.与计算机兼容:数码相机存储器里的图像输送到计算机后通过影像处理软件,可从事剪切,编辑、打印等,并可将影像存储在计算机中。
3.电信传送:数码相机可将图像信号转换为电子信号,经电信传输网或内部网进行传输。
第 30章 高技术输入输出设备
三、数码相机的基本结构数码相机与传统的胶片相机两者最大的区别是在它们各自的内部结构和原理上。它们的共同点是均由光学镜头、取景器、对焦系统、快门、光圈、内置电子闪光灯等组成,有的数码相机既有取景器还有液晶显示器 LCD。但数码相机还有其特殊的结构,
如 CCD或 CMOS、仿真信号处理器,A/D模数转换器,DSP数字信号处理器、图像处理器、图像存储器和输出控制单元等。
第 30章 高技术输入输出设备
以下是数码相机主要部件的主要功能:
1) 镜头主要功能:把光线会聚到 CCD或 CMOS图像传感器上,起到调整焦距的作用。对于定焦数码相机,镜头、物体和聚焦平面间的理想距离被精确计算,从而固定了镜头和光圈的位置。对于 ZOOM 数码相机,有一个机械装置,可以带动镜头组前后运动,一直让镜头保持在聚焦平面中央,能够捕捉到距离镜头的远近的物体。
第 30章 高技术输入输出设备
2) CCD( CMOS)图像传感器主要功能:把镜头传来的图像信号转变为仿真电信号。
3) A/D转换器主要功能:数码相机利用 A/D转换器将
CCD产生的仿真电信号转换为数字信号,并传输到图像处理单元。 4) 数字信号处理器主要功能:数字信号处理器主要功能是通过一系列复杂的数学运算法,如加、减、乘、除、积分等,对数字图像信号进行优化处理 (包括:白平衡、彩色平衡、伽玛校正与边缘校正等 )。
第 30章 高技术输入输出设备
5) 图像压缩主要功能:数码相机的图像处理包括数据压缩,图像压缩的目的是为了节省存储空间,利用 JPEG编码器把得到的图像转换为静止压缩的图像 (JPEG格式 )。
6) 总体控制电路主要功能:主控程序芯片
(MCU)能协调和控制测光、运算、曝光、闪光控制及拍摄逻辑控制。当电源开启时,
MCU则开始距检查各功能是否正常,若正常,
相机处于准备状态。
第 30章 高技术输入输出设备
四、数码相机的工作原理数码相机在使用过程中,半按快门对准被摄的景物
(快门 ON状态,与胶片相机相反 ),从镜头传来的光图像经过光电转换器 (CCD或 CMOS) 感应将光信号转换成为一一对应的仿真信号,再经 A/D模数转换器转换,把仿真电信号变成数字信号,最后经过图像处理器 DSP(Digital Signal Processor)和主控程序芯片 (MCU)按照指定的文件格式,把图像以二进制数码的形式显示在 LCD上,如按下快门,则把图像存入存储器中。
第 30章 高技术输入输出设备
数码相机的工作步骤大致分如下:
1 开机准备:当打开相机的电源时,其内部的主控程序就开始检测各部件是否正常。如某一部件有异常,内部的蜂鸣器就会发出警报或在 LCD上提示错误信息并停止工作。如一切正常,就进入准备状态。
2 聚焦及测光:数码相机一般都有自动聚焦和测光功能。当打开 DSC电源时,相机内部的主控程序芯片 (MCU)立即进行测光运算,曝光控制和闪光控制及拍摄逻辑控制。当对准物体并把快门按下一半时,MCU开始工作,图像信号经过镜头测光( TTL测光方式)传到 CCD或 CMOS上并直接以 CCD或
CMOS输出的电压信号作为对焦信号,经过 MCU的运算、比较再进行计算、确定对焦的距离和快门速度及光圈的大小,
驱动镜头组的 AF和 AE装置进行聚焦。
第 30章 高技术输入输出设备
3 图像捕捉:在聚焦及测光完成后再按下快门,摄像器件( CCD或 CMOS)就把从被摄景物上反射的光进行捕捉并以红、绿、蓝三种像素(颜色)存储。
4 图像处理:就是把捕捉的图像进行 A/D转换、图像处理、白平衡处理、色彩较正等,再到存储区合成在一起形成一幅完整的数字图像,在图像出来后再经过 DSP单元进行压缩转换为 JPEG格式(静止图像压缩方式),以便节省空间。
第 30章 高技术输入输出设备
5图像存储:在图像处理单元压缩的图像送到存储器中进行保存。
6 图像的输出:存储在数码相机存储器的图像通过输出端口可以输出送到计算机,可在计算机里通过图像处理程序(软件)进行图形编辑、处理、打印或网上传输等。
第 30章 高技术输入输出设备
在中高级的数码相机中,一般都含有 AE功能和 AF功能
1) AE功能当 DSC相机对准被摄物体时,CCD根据镜头传来的图像亮度的强弱,转变为 CCD数字电压信号,DSP再根据 CCD数字电压信号进行运算处理,再把运算结果传输给 MCU迅速找到合适的快门速度和镜头光圈的大小最佳值,
由 MCU控制 AE机构进行自动曝光。
第 30章 高技术输入输出设备
2) AF功能直接利用 CCD输出的数字电压信号作为对焦信号,经过 MCU的运算比较进行驱动镜头 AF
机构前后运动。
五、数码相机的分类目前数码相机的分类很多,如果按图像传感器来分,可分为 CCD数码相机和 CMOS数码相机。
第 30章 高技术输入输出设备
CCD数码相机
CCD数码相机是指数码相机使用 CCD图像传感器来记录图像,属中高档相机。 CCD本身是不能分辨各种颜色的光,要用不同颜色的滤色片配合使用,因此 CCD数码相机有以下两种工作方式:
1 利用透镜和分光镜将光图像信号分成 R,G,B三种颜色,并分别作用在三片 CCD上,这三种颜色的光经 CCD转换为仿真电信号,然后经 A/D转换器转换为数字信号,再经 DSP数字信号处理器处理后存储到存储器中。
第 30章 高技术输入输出设备
2 在每个像素点的位置上有三个分别加上 R,G,B
三种颜色滤色片的 CCD,经过透镜后的光图像信号被分别作用在不同的传感器上,并将它们转换为仿真电信号,然后经 A/D转换器转换为数字信号,再经 DSP数字信号处理器处理后存储到内存中。
CMOS数码相机
CMOS数码相机是指数码相机使用 CMOS图像传感器来记录图像。其工作方式与 CCD数码相机相似,
目前属低档相机。
第 30章 高技术输入输出设备
CCD图像传感器与 CMOS图像传感器比较:
CMOS图像传感器易与 A/D电路、数字信号处理器 DSP电路等集成在一起。 CCD图像传感器只能单一的锁存到成千上万的采样点上的光线的状态,CMOS则可以完成其它的许多功能,如 A/D转换,负载信号处理、白平衡处理及相机控制 (白平衡调调整就是通过图像调整,使在各种光线条件下拍的照片色彩与人眼看到的景物色彩一样 )。
第 30章 高技术输入输出设备
另外,CMOS图像传感器还有耗电小的优点,
其耗电量约为 CCD图像传感器的 1/10。但目前 CMOS图像传感器在解析力和色彩上还不如 CCD图像传感器,图像有噪音、准确捕捉动态图像的能力还不强。
第 30章 高技术输入输出设备
六、数码相机的聚焦聚焦是清晰成像的前提,数码相机一般都有自动聚焦功能。数码相机的自动聚焦功能与传统的胶片相机类似,也有主动式和被动式两种形式。
主动式就是相机主动发射红外线(或超声波),根据目标的反射进行 聚焦。
第 30章 高技术输入输出设备
数码相机的技术缺陷快门延时:对于传统相机而言,从按下快门键至快门释放这段延迟时间是可以被忽视的。而数码相机就不行,因为有一个快门时滞的问题,也就是说你按下快门后,CCD并没有马上捕捉光线,而是过一些时间后才开始工作。不同数码相机的快门时滞是不一样的,价格低廉的数码相机反应速度比较慢。这使得数码相机在拍摄运动物体时显得力不从心,随着技术的进步,快门延滞时间将会越来越少。
第 30章 高技术输入输出设备
长时间曝光:许多数码相机经过长时间曝光后的图像质量会有所下降,具体表现是:噪点比较多,色彩还原不自然,容易出现色斑和杂色,低端数码相机在这方面更为突出。
ISO值的设置:一般来说,数码相机制造商都采用胶卷感光度的标准来对 CCD的感光度进行划分,因此一台 ISO 80
数码相机的感光度与普通相机使用 ISO 80胶卷时是相同的。
一些价格昂贵的高档数码相机 ISO设置可调节,可增大到
ISO 200,400,800。这使得摄影师们拍摄高速运动的物体或处在弱光下的景物成为可能。虽然现在已经有 ISO3200的专业数码相机,但民用级数码相机所使用的 CCD感光度还很低,一般都不会 ISO400、不低于 ISO50,如深受行业人士看好的柯达 Pro Back感光度也只 ISO100。
第 30章 高技术输入输出设备
电池的使用时间:电池使用时间太短至今仍是让数码相机使用者和制造者头痛的事,各大数码相机生产厂家都在电池研制上花了不少功夫,相信这个问题会逐渐得到解决。
此外,在数码相机与传统相机的区别方面,还值得一提的是摄影观念上的差别。不同的操作必然会造成观念上的差异,而且这个差异将直接影响到数码相机的定位和发展。
第 30章 高技术输入输出设备
全球定位系统
1.1 基本原理
GPS 系统是由美国国防部的陆海空三军在 70
年代联合研制的新型卫星导航系统它的英文名称是,Navigation Satellite Timing And
Ranging / Global Positioning System” 其意为“卫星测时测距导航全球定位系统” 简称
GPS 系统第 30章 高技术输入输出设备
GPS 的定位原理实质上就是测量学的空间测距定位,
利用在平均 20200km 高空均匀分布在 6 个轨道上的
24 颗卫星发射测距信号码和载波,用户通过接收机接收这些信号测量卫星至接收机之距,通过一系列方程演算便可知地面点位坐标。
1.2 GPS 的组成
GPS 由三部分组成 GPS 空间部分地基监控站和
GPS 用户接收机部分第 30章 高技术输入输出设备第 30章 高技术输入输出设备第 30章 高技术输入输出设备
1.2.1 GPS 空间部分
GPS 空间部分由 24 颗分布在 6 个等间隔轨道上的卫星组成,卫星分布可保证全球任何地区任何时刻都不少于 4 颗卫星供观测,24颗卫星中 3 颗做为备份每个轨道平面上有 4 颗卫星它们按与地球成 55度 的相同方向运行空间间隔约为 90度。
第 30章 高技术输入输出设备
1、空间部分由 21颗工作卫星和 3颗备用卫星。
第 30章 高技术输入输出设备第 30章 高技术输入输出设备
每个 GPS 卫星都对应一组编号它们有多种编号一般采用 PRN(卫星所采用的伪随机噪声码)编号,
GPS 定位精度高低关键在于高稳定度的频率标准,
为此每颗 GPS 卫星都设有两台铷原子钟和两台铯原子钟。
1.2.2 地基监控站地基部分
地基监控站由一个主控站和四个监控站组成,主控站设置在美国大陆,四个监控站分别设在大西洋太平洋和印度洋诉岛屿上。
Colorado springs
5
5
Hawaii
Ascencion Diego Garcia
kwajalein
1个主控站,Colorado springs(科罗拉多,斯平士 )。
3个注入站,Ascencion(阿森松群岛 ),Diego Garcia(迭哥伽西亚 )、
kwajalein(卡瓦加兰 )。
5个监控站,以上主控站、注入站及 Hawaii(夏威夷 )。
第 30章 高技术输入输出设备
1.2.3 GPS 用户接收机
用户接收机通过接收多颗卫星的信号来解算出自身的位置以实现定位和导航,GPS 接收机按使用环境可分为中低动态接收机和高动态接收机,按所收信号可分为单频 C/A 码接收机和双频 P 码和 Y码接收机。
第 30章 高技术输入输出设备手持型 GPS机 车载型 GPS
机第 30章 高技术输入输出设备单频机双频机第 30章 高技术输入输出设备
GPS 提供 2 种水平的导航服务 — 精密定位服务 PPS
和标准定位服务 SPS,PPS 主要供美国及其盟国的军用和特殊许可部门,对一般用户只能使用单频
C/A 码定位。
由于美国的 GPS 政策所定使用单频 C/A 码还要受到 SA 的影响,即为降低精度而人为加入的一些干扰。因此一般单机定位精度为二维 100 米左右,对要求高的场合则需采用 DGPS 差分工作方式,精度可提高到 10 米,军用可到毫米级。
第 30章 高技术输入输出设备
3.1 GPS 传输信号分类
被传输的信号包含 2不同的信息
第一种是频率为 10.23MHz 的军用 P 码,美国政府禁止把该码提供给民用用户。
第二种是 C/A 码频率为 1.023MHz,用户用该码可以得到基本的定位信息。
第 30章 高技术输入输出设备
一、语音识别技术简介
计算机语音识别是一个模式识别匹配的过程。在这个过程中,
计算机首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的整体模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音匹配的模板。然后,据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型和语言模型的好坏、模板是否准确等都有直接的关系。
第 30章 高技术输入输出设备语音识别是一门交叉学科。语音识别过程实际上是一种认识过程,该过程与人对语音的识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论,一个完整的语音识别系统可大致分为三部分:
( 1)语音特征提取:操作员发出的语声波先由话筒接收并转换为电信号再进入自动识别系统,经过特征分析,把言语划分成一段段具有一定时间长度的音段序列,每一个音段的特征可以经编写组合成便于存储和便于比较的图形,语音特征提取就是从语音波形中提取出随时间变化的语音特征序列。
第 30章 高技术输入输出设备
( 2)声学模型与模式匹配:声学模型通常将获取的语音特征通过学习算法产生,它是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型的目的是提供一种有效的方法,计算语音的特征矢量序列和每个发音模板之间的距离。另外,
声学模型的设计和语言发音特点密切相关,必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小,在识别时将输入的语音特征同声学模型进行匹配与比较,得到最佳的识别结果。
第 30章 高技术输入输出设备
( 3)语言模型与语言处理:语言模型包括由识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。就像人们听语音时,并不把语音和语言的语法结构、语义结构分开来,因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程,对机器来说,识别系统也要利用这些方面的知识。语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义。
第 30章 高技术输入输出设备
语音识别原理第 30章 高技术输入输出设备
Bill Gates 在 97年世界计算机博览会
(COMDEX)主题演讲会上描绘 IT事业的发展宏图时,率先指出:
下一代操作系统和应用程序的用户界面将是语音识别。工业界应对语音识别领域的重大突破做好充分准备,因为那将是一场席卷全球的另一次热潮。
1998年 11月 5日,微软中国研究院在北京成立。
该中心的任务是重点研究计算机在中文环境下的易用性。
第 30章 高技术输入输出设备
IBM公司潜心研究语音识别技术迄今已达 30年之久,投资超过 2亿美元。
IBM公司于 1995年在北京成立了中国研究中心,中文语音信息处理成了该中心三大研究领域之一,并于 1997年 9月 4日,在北京推出了中文连续语音识别产品 ViaVoice。
第 30章 高技术输入输出设备
1998年,英特尔公司也宣布致力于推广语音识别技术,除了在北京举办首届语音技术国际论坛之外,还在北京、上海、成都、广州等地展开了“基于英特尔框架的语音识别技术”的宣传活动。
联合了七家世界著名学术机构(中科院自动化所、
清华大学、香港科技大学、香港中文大学、麻省理工学院、俄勒岗研究院,WATERLLOO大学)成立了
“国际语音技术研究组织”,致力于计算机语音技术的基础研究,以加速中文语音识别技术的发展。
第 30章 高技术输入输出设备
发音的生理机构肺活量声带
(声门) 咽腔软腭鼻腔口腔气管及支气管鼻音口音主声道,声门以上,经咽喉,口腔的管道 。
鼻 道,经小舌和鼻的管道称为鼻道 。
次声门系统:经肺,气管和支气管的管道 。
第 30章 高技术输入输出设备
语音的产生过程音源产生 声道调音 向外辐射
音源:声带音源,非声带音源
-声带振动周期,T (F0=1/T:基本频率 )
声道调音:对声道形状进行调整 。
-声道共振频率:
语音分类:
-浊音:由声带振动并激励声道而得到的语音 。
-清音:由气流高速冲过某处收缩的声道所产生的语音 。
第 30章 高技术输入输出设备
·构词规则
·同音字判决
·语法语义
·背景知识预处理 声学参数 分析 测度估计失真测度语音库判决专家知识库训练识别结果
·反混叠失真滤波器
·预加重器
·端点检测
·噪声滤波器
·欧氏距离
·似然比测度
○
语音信号输入第 30章 高技术输入输出设备
训练 (Training):预先分析出语音特征参数,制作语音模板 (Template)并存放在语音参数库中。
识别 (Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,
得出识别结果。
失真测度 (Distortion Measures):在进行比较时要有个标准,这就是计量语音特征参数矢量之间的“失真测度”。
主要识别框架,基于模式匹配的动态时间规整法
(DTW:Dynamic Time Warping)和基于统计模型的隐马尔柯夫模型法 (HMM:Hidden Markov Model)。
第 30章 高技术输入输出设备
在训练阶段,将特征参数进行一定的处理后,
为每个词条建立一个模型,保存为模板库。
在识别阶段,语音信号经过相同的通道得到语音特征参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。同时,还可以在很多先验知识的帮助下,提高识别的准确率。
第 30章 高技术输入输出设备
● 语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采 集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;
另外一个 问题是对用户的错误输入不能正确响应,
使用不方便。
●高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓 Lombard效应,必须寻找新的信 号分析处理方法。
第 30章 高技术输入输出设备
● 语言学、生理学、心理学方面的研究成果已有不少,但如何把这些知识量化,建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量 连续语音识别中是非常重要的。
●我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理 等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰 难的过程。
第 30章 高技术输入输出设备
● 语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要 解决,识别速度、拒识问题以及关键词(句)检测技术(即从连续语音中去除诸如,啊”、“唉”等语音,获得真正待识别的语音部分)等等技术细节要解决。
为了解决这些问题,研究人员提出了各种各样的方法,如自适应训练,基于最 大互信息准则( MMI)
和最小区别信息准则( MDI)的区别训练和“矫正”
训练;应 用人耳对语音信号的处理特点,分析提取特征参数,应用人工神经元网络 …… 所有 这些努力都取得了一定成绩。