一、语音识别中基于模糊聚类分析的参数聚类(论文文献综述)
顾苏杭[1](2020)在《面向风格数据的模糊聚类以及模糊深度学习方法研究》文中提出无监督学习和有监督学习一直是机器学习领域两个重要的研究方向,其中,聚类技术及分类技术已被广泛应用于智能医疗、图像识别、自然语言处理、视频分析、工业检测、智能交通等军事、工业、民用场所。特别是近十年,人工智能技术,尤其以深度学习技术为代表,已经发展到了新的高度。然而,伴随着各种聚类技术及分类技术的提出,如何合理地学习和运用样本特征本身一直是研究的热点问题。具体地,1)现有的绝大多数机器学习模型都是基于样本物理特征(如距离、颜色、相似度等)训练而得。然而,来自同一类的样本具有唯一的数据结构,且有别于其他类样本具有的数据结构。不同的数据结构明显或隐含具有独特的数据风格信息且有别于样本物理特征;2)真实数据集中都会存在干扰或噪声样本,如果在训练过程中忽视存在的噪声样本,会大大地影响机器学习模型的识别性能;3)利用传统的TSK模糊系统在解决大规模数据集分类的过程中易出现“规则爆炸”现象,与此同时,TSK模糊系统的泛化性及可解释性也会显着降低。针对上述存在的问题,本文进行了相关研究,分析和探讨了风格数据的模糊聚类和模糊深度学习在面对上述问题时的建模,主要研究成果如下:(1)针对不同类样本呈现明显或隐含的数据风格信息,提出一种基于数据物理特征和隐含风格特征的新型分类方法Fu CM。1)在训练阶段,Fu CM首先利用图论构建与数据集相对应的社交网络,每一样本及每一样本类分别对应社交网络中的节点与子网络。其次,引入模糊逻辑技术确定每一节点的模糊权重,在形成的模糊社交网络中挖掘节点隐含的数据风格信息,即节点的权威性和模糊影响力风格特征。特别地,将依据节点的局部浓度迭代计算节点的模糊影响力风格特征使其具有动态特性。2)在分类阶段,该方法基于样本物理特征和隐含的风格特征并权衡两种特征对分类所起的作用确定测试样本的真实标签。(2)从仿真人类认知事物的行为角度出发提出一种基于社交网络的风格数据分类方法S2CM。同样地,在训练阶段,S2CM探索社交网络的拓扑结构并挖掘数据风格信息,即社交网络中每一节点的权威性和影响力风格特征。在分类阶段,S2CM基于物理相似性和风格相似性双重假设确定测试样本的真实标签。通过定义的社交网络节点之间的距离,S2CM仿真人类认知事物特点的分类行为本质上等同于贝叶斯决策。(3)在(1)和(2)的基础上,作为首次尝试和研究,探索并设计针对风格数据的模糊风格聚类方法S-KPC,使得具有相同风格的样本被划分到同一聚类中。S-KPC在划分样本的过程中从两个方面分析不同聚类呈现的风格之间的差别并保证有效的聚类结果。具体地,S-KPC首先利用风格矩阵表达聚类结构及其风格信息。其次,S-KPC以增量表达的形式在样本原有特征的基础上形成增强节点以逐步打开数据的流形结构,使得样本易于被划分。(4)基于主动对抗样本学习,提出一种具有新型栈式结构的模糊深度分类器DSA-FC。1)通过主动随机攻击训练集中小部分样本标签使之成为对抗样本,并利用TSK模糊系统学习包含对抗样本的训练集,谓之主动对抗样本学习;2)主动对抗样本学习为DSA-FC奠定坚实的理论基础;3)基于主动对抗样本学习及栈式结构原理的新型栈式结构保证了DSA-FC具有高度可解释性及优秀的泛化性能。(5)利用(4)中提出的DSA-FC解决大规模数据集上的分类问题时会出现“规则爆炸”现象,显着降低DSA-FC模型的可解释性,且DSA-FC模型训练十分耗时。在保证DSA-FC泛化性能不受影响的前提下,提出DSA-FC的快速训练算法FTA。1)FTA将通过梯度引导学习精简训练DSA-FC需要的模糊规则从而提高DSA-FC模型训练速度及增强DSA-FC的可解释性;2)经FTA算法训练生成的DSA-FC的栈式结构将由精简后的模糊规则确定;3)基于极值分布的理论分析表明梯度引导学习能够为DSA-FC提供额外的泛化性以及弱化DSA-FC中模糊规则之间的自适应能力。
张雄涛[2](2019)在《模糊TSK系统的深度集成研究》文中研究表明近年来,机器学习随着人工智能的火热得到了如火如荼地发展,在推荐系统、机器翻译、语音识别等领域得到了广泛而成功应用。但是,随着应用场景的不断扩大,数据的规模和形式也变得复杂,多样化的数据场景,例如含有噪音特征和噪音标签的训练数据等,给传统的机器学习方法带来了巨大的挑战。在有监督机器学习中,经典的神经网络和TSK模糊系统在面对这些复杂的数据场景时,往往会遇到如下问题:由于技术的限制,采集到的数据不可避免的含有噪音或不确定数据。当使用这些含有噪音和不确定信息的数据进行学习建模时,得到的模型往往泛化性能较差;其次,采集到的原始数据,不可避免的会被工人标注错,或不能确定其类标。如何对错误的类标进行矫正,也是一个亟需要解决的问题。针对上述问题,本文将在现有经典机器学习的基础之上,通过构建不同的集成分类器,以期得到能够解决在复杂数据场景下的建模方法,主要研究成果如下:(1)提出了一种基于模糊划分和模糊加权的集成深度信念网络FE-DBN,用于处理大规模复杂数据的分类问题。首先通过模糊聚类算法对输入数据空间进行模糊划分,将训练数据划分为多个子集,然后利用多个不同结构的DBN独立的对各个子集并行进行训练,凭借DBN强大的神经表达能力逐层去掉各子集中原始数据的不确定信息,最后基于模糊理论思想,将每个分类器的结果进行模糊加权。根据集成原理,FE-DBN可提高DBN的泛化性能,并加速训练时间;(2)提出了一种新型的集成TSK模糊分类器EP-TSK-FK,首先通过并行学习的方式组织所有零阶TSK模糊子分类器,然后每个子分类器的输出被扩充到原始(验证)输入空间,最后通过提出的迭代模糊聚类算法(Iterative fuzzy C-means clustering algorithm,IFCM)作用在增强验证集上生成数据字典,从而利用KNN对测试数据进行快速预测。EP-TSK-FK具有以下优点:以并行学习方式训练其所有零阶TSK模糊子分类器;在EPTSK-FK中,每个零阶TSK子分类器的输出被扩充到原始(验证)输入空间,以便以并行方式打开原始(验证)输入空间中存在的流形结构。因此,根据堆栈泛化原理,可以保证提高分类精度;和其它按顺序训练的分层结构和Boosting结构模糊分类器相比,EPTSK-FK以并行方式组织所有的子分类器,因此运行速度可以得到有效保证;由于EPTSK-FK是在以IFCM&KNN所获得的数据字典的基础上进行分类的,因此具有强鲁棒性。理论和实验验证了模糊分类器EP-TSK-FK具有较高的分类性能、强鲁棒性和高可解释性;(3)提出了一种称为DBN-TSK-FC的新型模糊深度分类器,使之能同时利用模糊表达强大的不确定性处理能力和基于DBN的神经表达的突出抗噪能力对数据进行分类。在所提出的分类器DBN-TSK-FC中,通过在原始数据集上使用经典的模糊聚类算法FCM(fuzzy c-means clustering algorithm FCM),从而形成模糊规则的前件部分,并作为原始数据集的模糊表达;而基于DBN的神经表达则是通过在现有的DBN学习过程中只对训练数据应用相同的无监督预训练,然后将对应的DBN结构中顶层的所有隐层节点的神经表达作为模糊规则的后件变量。以这种方式,通过将后件参数的学习问题转化为线性回归问题,从而利用最小学习机LLM(Least Learning Machine)求得后件参数的最优解,可解释的模糊表达和基于DBN的神经表达被进一步集成以快速形成相应的模糊规则。因此,从模糊规则的角度来看,DBN-TSK-FC本质上是一种新型的TSK模糊分类器,它使DBN的行为在所提出的分类器中是可以解释的。标准UCI数据集的实验结果验证了所提出的分类器DBN-TSK-FC的有效性;最后将DBN-TSK-FC成功应用于AAL(Ambient Assisted Living)中的室内用户移动预测中;(4)在第3章基于模糊聚类和KNN的集成TSK模糊分类器EP-TSK-FK基础上,提出了一种改进型具有标签抗噪能力的集成TSK模糊分类器EW-TSK-CS。在EW-TSKCS中,每一个子分类器TSK-noise-FC在原始零阶TSK模糊分类器目标函数的基础上,增加了两个约束,分别对应不确定标签和错误标签,即标签噪音。在EW-TSK-CS的决策阶段,由于我们在此只考虑二分类问题中的标签噪音问题,因此选用FCM&KNN。每一个子分类器的输出被当做验证数据的增强特征从而打开原始数据空间中的流行结构,从而保证了所提出的EW-TSK-CS的高效性。在实验部分,我们在UCI数据集上模拟真实众包环境中的标签噪音矫正问题,验证了所提出的EW-TSK-CS的性能。最后在电力价格数据集上展示了集成模糊分类器EW-TSK-CS的高可解释性。EW-TSK-CS具有2个非常重要的特征:1)每一个子分类器都是TSK模糊分类器TSK-noise-FC,且EW-TSK-CS并行训练所有的子分类器,没有中间变量的存在,因此保证了EW-TSK-CS具有高可解释性;2)每一个子分类器的目标函数中考虑了标签噪音的存在,因此EWTSK-CS具有较强的标签噪音抗噪能力。
吴鹏[3](2019)在《机载环境下的语音识别关键技术的研究》文中指出语音识别技术是近三十年来的热门研究课题,也是一门综合性很强的学科,有着远大的应用前景。虽然在当今社会已经涌现出不少的语音产品,但在应用过程中还存在着各种各样的问题,特别是在某种特定的背景下,因此本文着重于对机载环境下的语音识别技术展开研究。详细介绍了语音识别的实现流程与系统架构,阐述了语音识别系统的各个组成部分的基本原理,包括预处理、端点检测、特征提取以及识别的方法。提出一种结合谱减法与短时零熵的检测方法。该方法在检测的前端部分运用谱减法进行降噪处理,并融合了短时过零率和功率谱熵,构造出一种新的语音参数,即短时零熵。经实验证明,该算法能够在机载环境下取得较为满意的检测效果。提出一种基于HHT变换的改进MFCC特征。该方法是将HHT变换取代FFT变换进行时频分析,且在MFCC特征的高频部分采用Teager能量,得到一种改进MFCC参数。实验结果表明,该参数在机载环境下有着良好的稳健性和鲁棒性。在HMM的理论基础上,以Matlab软件作为开发平台,搭建一个基于机载指令的语音识别系统,并展现了识别流程中的各个环节的操作界面与仿真结果。最终的演示结果表明改进算法在机载环境下具有很好的应用价值。
武利娟[4](2016)在《基于图像序列的嘴唇分割算法研究》文中认为随着人工智能的发展,多媒体交互技术越来越得到相关领域研究者的关注。而语音识别技术作为交互技术的核心之一也得到了快速的发展。但是,在噪声和干扰下,语音识别率明显下降,从而使得作为语音识别辅助技术的唇读技术得到了更多的关注。而嘴唇分割是作为唇读技术的第一步至关重要。本文分析了嘴唇分割的相关算法,然后提出了在模糊聚类框架内基于运动信息的嘴唇图像序列分割算法。基于运动信息的模糊聚类嘴唇图像序列分割算法是在模糊聚类的框架内融入运动信息和参考颜色信息,从而实现对嘴唇图像序列的快速准确分割。通过分析嘴唇图像序列,作者发现两点信息:1)由于嘴唇的运动是连续的,对于那些运动较小或者静止的像素点,它们被分为嘴唇类和非嘴唇类的概率也应与上一帧保持连续性,而运动剧烈的像素点则没有这种连续性。并且,本文选择用Lucas-Kanade算法计算的光流矢量来表示帧间的嘴唇运动信息;2)对于同一个人的嘴唇序列来说,他/她的嘴唇颜色不会发生较大的变化,那么,嘴唇的聚类中心也不会发生较大的移动。因此,可以在目标函数中加入一个参考的颜色信息惩罚项来约束嘴唇聚类中心的变化。实验结果表明本文提出的嘴唇分割算法在处理嘴唇序列的时候比其它优秀的算法更加的稳定,准确性也更高。并且,在嘴唇分割基础上,本文用一个16点模型来提取嘴唇轮廓。轮廓提取的结果非常的精确,从侧面证明了本文提出的基于运动信息的模糊聚类算法的嘴唇分割效果更好。
徐向华,朱杰,郭强[5](2004)在《语音识别中基于模糊聚类分析的参数聚类》文中研究指明为减少语音识别中声学模型的参数量,提高参数训练的鲁棒性,基于声学决策树结构,提出利用模糊聚类分析方法对模型参数聚类,包括高斯聚类和方差共享.对大词汇量汉语连续语音识别的实验结果表明:高斯模糊聚类使高斯数减少25%时,识别率提高了0.15%.进一步做模糊方差共享,当方差减少到初始模型的24%,与同样参数量的未进行聚类的模型相比,误识率下降了3.01%,证明了模糊聚类分析在语音参数聚类中的有效性.
杨凤芹[6](2009)在《基于粒子群的优化方法研究》文中研究说明本文利用粒子群优化(Particle Swarm Optimization, PSO)算法对隐马尔可夫模型(Hidden Markov Model, HMM)参数优化问题、模糊聚类问题、K-调和均值(K-harmonic means, KHM)聚类问题和柔性作业车间调度问题(Flexible Job-shop Scheduling Problem, FJSP)进行了研究,提出了相应的优化算法。主要研究内容包括:(1)研究了基于PSO的HMM参数优化方法。Baum-Welch(BW)算法是HMM参数优化的经典算法,该算法是基于梯度下降的局部优化算法,容易陷入局部最优。为此本文提出了基于PSO算法和BW算法的连续HMM参数优化算法(PSOBW)。实验结果表明,PSOBW算法不仅能提高PSO算法的收敛速度,而且能帮助BW算法跳出局部最优,PSOBW算法也明显优于基于遗传算法(GA)和BW算法的连续HMM参数优化算法(GABW)。(2)研究了基于PSO的模糊聚类方法。针对FCM算法容易陷入局部最优的缺陷提出了一种基于PSO算法和FCM算法的混合模糊聚类算法HPSOFCM。为了将基于PSO算法的混合模糊聚类算法与基于差分进化(Differential Evolution, DE)算法的模糊聚类算法进行比较,我们用DE算法代替HPSOFCM算法中的PSO算法形成了混合模糊聚类算法HDEFCM。实验结果表明,混合模糊聚类算法HPSOFCM和HDEFCM都在某种程度上改进了FCM算法的性能,但HPSOFCM算法比HDEFCM算法速度快。(3)研究了基于PSO的KHM聚类算法。为了克服KHM算法容易落入局部最优的缺点,本文提出了一种基于PSO算法和KHM算法的混合聚类算法PSOKHM。我们对算法PSOKHM、KHM和PSO进行实验比较,实验结果表明PSOKHM既提高了PSO算法的收敛速度,也能有效地帮助KHM算法逃出局部最优。(4)研究了基于PSO的FJSP的求解方法。提出了一种求解FJSP的离散粒子群算法,该算法采用两个向量表示问题的解。根据问题的特征和解的表示结构,我们借鉴了遗传算法中交叉和变异的思想实现了粒子的运动,并针对该具体问题设计了交叉和变异算子。实验结果证明了所提出算法的有效性。
林琳[7](2007)在《基于模糊聚类与遗传算法的说话人识别理论研究及应用》文中指出本文的研究工作主要有两个方面:1.针对短语音(训练语音少于8秒)的说话人识别系统,将模糊聚类分析的思想引入到模型的训练中,并在此基础上提出了四种基于模糊聚类的短语音说话人识别算法。2.针对高斯混合模型对初值敏感,容易陷入局部极小值而得不到最优解的问题,将具有全局优化特性的遗传算法引入到高斯混合模型的优化中,分析了基本遗传算法存在的问题,提出了两种高斯混合模型的优化方法,并应用到说话人识别中。论文的主要研究内容如下:(1)提出了基于遗传-模糊聚类分析的说话人识别算法,利用遗传算法的全局优化特性,改善了模糊聚类分析的说话人识别算法对初值敏感的问题,使算法在较短训练语音的说话人识别中体现了较强的优势。(2)研究基于核方法的短语音说话人识别。将核方法引入到说话人识别中,提出基于模糊核矢量量化的说话人识别算法,并在此基础上,引入熵的概念,提出了基于模糊核熵的说话人识别算法,进一步提高了短语音说话人识别系统的性能。(3)提出了基于可区分性模糊核矢量量化的短语音说话人识别算法,利用语音信号的不同部分在不同说话人之间的唯一区分特性,进一步增加了说话人之间的区分性,使算法在训练语音少于8秒时,得到较好的识别结果。(4)利用遗传算法及模糊聚类分析对高斯混合模型进行优化,研究了基于遗传-模糊高斯混合模型的说话人识别,改善了高斯混合模型初值敏感的问题,提高了系统的识别率。(5)针对遗传算法“早熟”和局部搜索能力较弱的问题,研究了基于自适应小生境遗传算法的说话人识别,进一步提高了算法的寻优能力,得到了更优的模型参数。
刘宇红,刘桥,任强[8](2006)在《基于模糊聚类神经网络的语音识别方法》文中研究说明提出了一种基于模糊神经网络的语音识别方法.该方法以模糊系统模型为基础,利用改进的模糊聚类辨识算法,构成一种新型的模糊聚类神经网络(FCNN),并将其作为概率密度函数的估计器,对每个状态的输出进行预测.它不仅能有效地在语音识别中引入帧间相关信息,而且能克服状态输出概率密度函数为混合高斯分布的束缚.通过对非特定人汉语孤立词和连续音节的语音识别实验,证实了该方法的有效性.
徐向华,朱杰,郭强[9](2005)在《一种基于模糊聚类分析的异音混合共享模型》文中研究说明为减少语音识别中声学模型的参数量,提高参数训练的鲁棒性,提出了一种基于升值法模糊聚类的异音混合共享模型。在决策树结构的基础上,通过对初始三音子模型的高斯函数做模糊聚类得到该模型的高斯码本,并进一步通过对模型的方差做模糊聚类完成对方差的共享。识别实验结果表明,与相近高斯数量的传统异音混合共享模型相比,提出的异音混合共享模型的高斯权值数减少77.59%时,识别率提高7.92%;与相近参数量的三音子模型相比,方差共享的异音混合模型误识率降低了3.01%。
何清,徐树富,王加银,史忠植[10](2001)在《FCMBP聚类法在语音识别和模糊控制中的应用》文中提出首先从理论上证明了 FCMBP模糊聚类方法 ,即基于摄动的模糊聚类方法 ,比传递闭包法失真小 ;其次 ,用例子说明这两种聚类方法的聚类结果并不总是相同 ,有时还会产生本质差异 ;再次 ,提出用 FCMBP模糊聚类方法设立语音模式的参考向量集来进行语音识别 ,该方法能提高语音识别的正确率 ;最后 ,利用 FCMBP模糊聚类方法滤除量测数据对中的噪声 ,再用这些处理过的数据构造模糊控制规则 ,从而达到模糊控制规则的优化 .
二、语音识别中基于模糊聚类分析的参数聚类(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、语音识别中基于模糊聚类分析的参数聚类(论文提纲范文)
(1)面向风格数据的模糊聚类以及模糊深度学习方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 本文研究背景 |
1.2 机器学习研究现状 |
1.2.1 监督学习研究现状 |
1.2.2 无监督学习研究现状 |
1.3 本文主要内容、特色和创新 |
第二章 基于数据物理特征和隐式风格特征的新型分类方法 |
2.1 引言 |
2.2 模糊社交网络及其动态特性 |
2.2.1 模糊社交网络的构建 |
2.2.2 节点模糊影响力的动态特性 |
2.3 基于数据物理特征和隐式风格特征的新型分类方法 |
2.3.1 概述 |
2.3.2 基于节点浓度的模糊影响力 |
2.3.3 基于样本物理特征和隐式风格特征的模糊分类 |
2.3.4 FuCM算法描述及其复杂度分析 |
2.4 实验与分析 |
2.4.1 人造数据集实验 |
2.4.2 真实数据集实验 |
2.4.3 应用案例研究 |
2.5 本章小结 |
第三章 基于社交网络的风格数据分类方法 |
3.1 引言 |
3.2 S2CM的设计方法 |
3.2.1 S2CM总体思路 |
3.2.2 构建社交网络 |
3.2.3 基于双假设的分类 |
3.2.4 S2CM算法描述及其复杂度分析 |
3.3 实验与分析 |
3.3.1 人造数据集实验 |
3.3.2 真实数据集实验 |
3.3.3 EEG信号识别 |
3.4 本章小结 |
第四章 模糊风格K平面聚类 |
4.1 引言 |
4.2 S-KPC的设计方法 |
4.2.1 动机及目标函数 |
4.2.2 目标函数的优化 |
4.2.3 S-KPC算法描述及其复杂度分析 |
4.2.4 S-KPC执行演示 |
4.3 实验与分析 |
4.3.1 实验设置 |
4.3.2 人造数据集实验 |
4.3.3 真实数据集实验 |
4.3.4 应用案例研究 |
4.4 本章小结 |
第五章 基于主动对抗学习的新型模糊深度分类器 |
5.1 引言 |
5.2 对抗的TSK模糊分类器及其训练 |
5.3 新型模糊深度分类器DSA-FC |
5.3.1 DSA-FC的栈式结构 |
5.3.2 深度学习算法 |
5.3.3 关于预测 |
5.3.4 算法复杂度分析 |
5.4 实验与分析 |
5.4.1 实验设置 |
5.4.2 真实数据集 |
5.4.3 可解释性与参数分析 |
5.4.4 应用案例研究 |
5.5 本章小结 |
第六章 基于梯度引导学习的对抗模糊深度分类器及其快速训练算法 |
6.1 引言 |
6.2 快速训练算法FTA |
6.2.1 梯度引导学习 |
6.2.2 理论分析 |
6.2.3 快速训练算法 |
6.3 实验与分析 |
6.3.1 实验配置 |
6.3.2 真实数据集 |
6.3.3 可解释性与参数分析 |
6.4 本章小结 |
第七章 结束语 |
致谢 |
参考文献 |
附录 |
附录1 :攻读博士学位期间撰写的相关论文、专利列表 |
附录2 :攻读博士学位期间参加的科研项目列表 |
(2)模糊TSK系统的深度集成研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 经典机器学习研究现状 |
1.2.1 模糊系统研究现状 |
1.2.2 深度学习研究现状 |
1.2.3 集成学习研究现状 |
1.3 课题研究内容和本文结构 |
第二章 基于模糊划分和模糊加权的集成深度信念网络 |
2.1 引言 |
2.2 基于模糊划分和模糊加权的DBN分类器集成 |
2.2.1 FE-DBN结构图 |
2.2.2 实现过程 |
2.3 算法及其复杂度分析 |
2.3.1 FE-DBN算法描述 |
2.3.2 时间复杂度分析 |
2.4 实验与分析 |
2.4.1 实验设置 |
2.4.2 人造数据集实验 |
2.4.3 UCI数据集实验 |
2.5 本章小结 |
第三章 基于模糊聚类和KNN的具有高可解释的并行集成模糊分类器 |
3.1 引言 |
3.2 迭代模糊聚类算法IFCM |
3.3 EP-TSK-FK |
3.3.1 EP-TSK-FK的架构 |
3.3.2 EP-TSK-FK算法描述 |
3.3.3 时间复杂度分析 |
3.3.4 理论证明 |
3.4 实验分析 |
3.4.1 实验设置 |
3.4.2 UCI和 KEEL数据集实验 |
3.4.3 非参数统计分析 |
3.4.4 运行原理及可解释性展示 |
3.5 本章小结 |
第四章 基于DBN的模糊深度分类器及其在AAL中的应用 |
4.1 引言 |
4.2 现有的模糊深度分类器 |
4.3 DBN-TSK-FC |
4.3.1 DBN-TSK-FC的架构 |
4.3.2 DBN-TSK-FC训练及预测算法 |
4.3.3 时间复杂度分析 |
4.4 实验与分析 |
4.4.1 实验设置 |
4.4.2 UCI数据集实验 |
4.4.3 非参数统计分析 |
4.4.4 AAL数据集实验 |
4.5 本章小结 |
第五章 具有标签抗噪能力的集成TSK模糊分类器及其在众包中的应用 |
5.1 引言 |
5.2 准备知识 |
5.3 TSK-noise-FC |
5.4 EW-TSK-CS |
5.4.1 EW-TSK-CS的结构 |
5.4.2 EW-TSK-CS的算法描述 |
5.4.3 时间复杂度分析 |
5.5 实验与分析 |
5.5.1 实验设置 |
5.5.2 UCI数据集仿真实验 |
5.5.3 非参数统计分析 |
5.5.4 电力价格数据集实验 |
5.6 本章小结 |
第六章 结束语 |
致谢 |
参考文献 |
附录 |
附录1 :攻读博士学位期间发表的论文 |
附录2 :攻读博士学位期间参与的科研项目 |
(3)机载环境下的语音识别关键技术的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 语音识别的研究背景与意义 |
1.2 语音识别研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 语音识别在航空领域的应用 |
1.4 主要研究内容 |
1.5 论文的组织机构 |
第二章 语音识别技术的基本理论 |
2.1 .语音识别的概述 |
2.1.1 语音识别的分类 |
2.1.2 语音的产生机理和模型 |
2.1.3 语音识别的系统构架 |
2.2 语音信号的预处理 |
2.2.1 语音的采集 |
2.2.2 预加重 |
2.2.3 分帧加窗 |
2.2.4 端点检测 |
2.3 语音信号的特征提取 |
2.4 主要的识别算法 |
2.5 本章小结 |
第三章 改进的短时零熵端点检测方法 |
3.1 引言 |
3.2 传统的端点检测算法 |
3.2.1 基于时域特征-短时能量和过零率 |
3.2.2 基于频域特征-功率谱熵 |
3.3 基于谱减法和短时零熵值的端点检测算法 |
3.3.1 机载噪声的特点 |
3.3.2 谱减法 |
3.3.3 短时零熵值的定义 |
3.3.4 门限估计算法 |
3.3.5 基于谱减法和短时零熵的端点检测 |
3.4 实验及结果分析 |
3.5 本章小结 |
第四章 基于HHT变换的改进MFCC特征提取 |
4.1 引言 |
4.2 常用的特征提取方法 |
4.2.1 线性预测倒谱系数 |
4.2.2 MFCC倒谱系数 |
4.3 Hilbert-Huang变化 |
4.3.1 EMD分解的原理及过程 |
4.3.2 Hilbert谱分析 |
4.4 基于HHT变化的特征提取方法 |
4.4.1 Teager能量算子 |
4.4.2 基于HHT变换的改进MFCC特征提取 |
4.5 仿真实验及结果分析 |
4.6 本章小结 |
第五章 HMM语音识别系统的研究 |
5.1 HMM模型的概念 |
5.2 HMM的定义及基本参数 |
5.3 HMM的类型及三大问题 |
5.4 HMM的基本算法 |
5.4.1 前向-后向算法 |
5.4.2 Viterbi算法 |
5.4.3 Baum-Welch算法 |
5.5 HMM的实现 |
5.6 本章小结 |
第六章 机载语音识别系统的实验仿真 |
6.1 实验平台的搭建 |
6.1.1 语音库的建立 |
6.1.2 语音识别系统的主界面 |
6.2 HMM的训练和识别 |
6.3 实验结果的分析 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 本文总结 |
7.2 展望 |
致谢 |
攻读硕士学位期间主要的研究成果 |
参考文献 |
附录一 插图清单 |
附录二 表格清单 |
(4)基于图像序列的嘴唇分割算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究进展及现状 |
1.3 本文的主要工作 |
1.4 论文的结构安排 |
第二章 嘴唇分割和建模算法 |
2.1 嘴唇分割技术 |
2.2 嘴唇建模技术 |
2.2.1 动态轮廓模型(Snake) |
2.2.2 变形模板 |
2.2.3 主动形状模型和主动外貌模型 |
2.2.4 嘴唇建模技术的讨论 |
2.3 本章小结 |
第三章 基于运动信息的模糊聚类图像序列嘴唇分割算法 |
3.1 模糊聚类算法 |
3.1.1 嘴唇图像序列分割问题 |
3.1.2 加入空间惩罚的FCM(MS-FCM) |
3.2 运动信息的表示 |
3.2.1 嘴唇图像序列分割问题 |
3.2.2 光流法 |
3.3 基于运动信息的模糊聚类嘴唇分割算法 |
3.3.1 算法的改进 |
3.3.2 目标函数的构建 |
3.3.3 公式的迭代 |
3.4 本章小结 |
第四章 实验结果和分析 |
4.1 标准唇语数据库 |
4.2 色彩空间的选取 |
4.3 参数的选择 |
4.3.1 参数的h选取 |
4.3.2 参数m的选取 |
4.3.3 参数σ的选取 |
4.3.4 参数K的选取 |
4.3.5 小结 |
4.4 算法的实现及实验结果 |
4.4.1 算法的实现 |
4.4.2 对比实验结果与分析 |
4.4.3 嘴唇轮廓的提取 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 本文工作总结 |
5.2 研究展望 |
参考文献 |
致谢 |
攻读硕士学位期间已发表或录用的论文 |
(5)语音识别中基于模糊聚类分析的参数聚类(论文提纲范文)
1 基于模糊聚类分析的参数聚类 |
1.1 模糊聚类分析[4] |
1.2 高斯聚类 |
1.3 方差共享 |
2 仿真实验 |
3结语 |
(6)基于粒子群的优化方法研究(论文提纲范文)
内容提要 |
第1章 绪论 |
1.1 最优化问题 |
1.1.1 最优化问题 |
1.1.2 传统优化方法 |
1.1.3 基于进化计算的优化方法 |
1.2 HMM 及其优化方法 |
1.2.1 HMM |
1.2.2 基于进化计算的HMM 优化方法 |
1.3 模糊聚类问题 |
1.3.1 模糊聚类问题 |
1.3.2 基于进化计算的模糊聚类方法 |
1.4 K-调和均值聚类问题 |
1.4.1 K-调和均值聚类问题 |
1.4.2 基于进化计算的K-调和均值聚类方法 |
1.5 柔性作业车间调度问题 |
1.5.1 柔性作业车间调度问题 |
1.5.2 基于进化计算的FJSP 求解方法 |
1.6 本文的主要成果和内容安排 |
1.6.1 本文的主要成果 |
1.6.2 本文的内容安排 |
第2章 粒子群优化算法 |
2.1 引言 |
2.2 粒子群的种群动力学 |
2.2.1 原始PSO 算法 |
2.2.2 参数 |
2.2.3 惯性权重 |
2.2.4 压缩系数 |
2.2.5 全信息粒子群 |
2.3 种群拓扑 |
2.3.1 静态拓扑结构 |
2.3.2 动态拓扑 |
2.4 PSO 算法的变体 |
2.4.1 二进制PSO 算法 |
2.4.2 求解动态问题的PSO 算法 |
2.4.3 具有噪声函数的PSO 算法 |
2.4.4 混合与自适应PSO 算法 |
2.4.5 具有多样性控制的PSO 算法 |
2.5 理论分析 |
2.5.1 确定的模型 |
2.5.2 建模PSO 的随机性 |
2.5.3 可执行模型 |
2.6 有待研究的问题 |
2.6.1 初始化和终止条件 |
2.6.2 粒子的选择、移动和评估 |
2.6.3 记忆的选择和更新 |
2.6.4 自适应调整 |
2.6.5 理论方面 |
2.7 本章小结 |
第3章 基于PSO 的HMM 优化方法 |
3.1 引言 |
3.2 HMM |
3.2.1 HMM 的定义 |
3.2.2 HMM 中的3 个基本问题及其解决方案 |
3.2.3 HMM 的类型 |
3.2.4 HMM 算法实现的问题 |
3.3 基于PSO 的连续语音识别中连续HMM 优化方法 |
3.3.1 连续语音识别中连续HMM 优化方法 |
3.3.2 基于PSO 的连续语音识别中连续HMM 优化方法 |
3.4 本章小结 |
第4章 基于PSO 的模糊聚类 |
4.1 引言 |
4.2 聚类的基本概念 |
4.2.1 数据集 |
4.2.2 簇与聚类原型 |
4.2.3 聚类方法 |
4.3 硬划分与模糊划分 |
4.3.1 硬划分 |
4.3.2 模糊划分 |
4.3.3 概率划分 |
4.4 FCM 聚类 |
4.4.1 FCM 函数 |
4.4.2 FCM 算法 |
4.4.3 FCM 算法参数 |
4.5 基于PSO 和FCM 的模糊聚类 |
4.5.1 编码机制 |
4.5.2 基于PSO 和FCM 的模糊聚类算法 |
4.5.3 基于DE 和FCM 的模糊聚类算法 |
4.5.4 实验 |
4.6 本章小结 |
第5章 基于PSO 的K-调和均值聚类 |
5.1 引言 |
5.2 K-调和均值聚类 |
5.2.1 调和均值 |
5.2.2 KHM 算法与KM 算法的目标函数比较 |
5.2.3 KHM 聚类算法 |
5.3 基于PSO 和KHM 的混合聚类算法 |
5.3.1 基于PSO 和KHM 的混合聚类算法 |
5.3.2 实验 |
5.4 本章小结 |
第6章 基于PSO 的柔性作业车间调度问题求解方法 |
6.1 引言 |
6.2 FJSP |
6.2.1 FJSP 的描述 |
6.2.2 FJSP 的优化目标函数 |
6.3 FJSP 的编码方法 |
6.3.1 并行作业编码方法 |
6.3.2 两向量编码方法 |
6.3.3 工序机器编码方法 |
6.3.4 基于优先权的编码方法 |
6.4 基于PSO 的FJSP 求解方法 |
6.4.1 编码方法 |
6.4.2 改进的PSO 算法 |
6.4.3 实验 |
6.5 本章小结 |
第7章 结论 |
7.1 结论 |
7.2 未来的工作 |
参考文献 |
攻读博士学位期间发表的论文及参加的项目 |
致谢 |
摘要 |
Abstract |
(7)基于模糊聚类与遗传算法的说话人识别理论研究及应用(论文提纲范文)
提要 |
第一章 绪论 |
1.1 引言 |
1.2 说话人识别的研究背景 |
1.3 说话人识别的发展概况及现状 |
1.4 模糊理论的发展概况 |
1.5 遗传算法的发展概况 |
1.6 本文的研究内容 |
第二章 基础知识 |
2.1 说话人识别基本原理 |
2.1.1 说话人识别的分类 |
2.1.2 说话人识别的系统结构 |
2.2 说话人识别的特征提取 |
2.3 说话人识别的主要方法 |
2.3.1 模板匹配法 |
2.3.2 矢量量化法 |
2.3.3 概率统计模型法 |
2.3.4 人工神经网络法 |
2.3.5 支持向量机法 |
2.4 模糊理论及模糊聚类分析 |
2.4.1 模糊集合 |
2.4.2 分解定理和扩展定理 |
2.4.3 模糊聚类分析 |
2.5 遗传算法 |
2.5.1 基本遗传算法的构成要素 |
2.5.2 模式定理和隐含并行性 |
2.5.3 遗传算法的收敛性 |
第一篇 模糊聚类分析的短语音说话人识别理论研究 |
第三章 基于遗传-模糊聚类分析的说话人识别 |
3.1 概述 |
3.2 基于模糊聚类分析的说话人识别 |
3.3 基于遗传-模糊聚类分析的说话人识别 |
3.3.1 遗传-模糊聚类分析 |
3.3.2 语音信号的端点检测 |
3.3.3 最大总平均模糊隶属度准则 |
3.4 仿真实验 |
3.4.1 高斯类数据分类实验 |
3.4.2 说话人识别实验 |
3.5 本章小结 |
第四章 基于核方法的短语音说话人识别 |
4.1 概述 |
4.2 核方法 |
4.3 基于模糊核矢量量化的说话人识别 |
4.3.1 模糊核矢量量化 |
4.3.2 模糊核最近近邻分类器 |
4.4 基于模糊核熵的短语音说话人识别 |
4.4.1 特征空间的模糊核熵目标函数 |
4.4.2 模糊核熵矢量量化 |
4.4.3 基于模拟退火的模糊熵度更新 |
4.4.4 特征空间中的模糊熵最近近邻分类器 |
4.5 仿真实验 |
4.6 本章小结 |
第五章 基于可区分性的模糊核短语音说话人识别 |
5.1 概述 |
5.2 特征空间中的模糊最近近邻分类器 |
5.3 特征空间中的可区分性加权匹配 |
5.3.1 模糊核加权最近近邻分类器 |
5.3.2 特征空间中的权值分配 |
5.4 基于可区分性的模糊核短语音说话人识别算法 |
5.5 仿真实验 |
5.6 本章小结 |
第二篇 基于遗传算法的说话人识别研究 |
第六章 基于遗传-模糊高斯混合模型的说话人识别 |
6.1 概述 |
6.2 模糊高斯混合模型 |
6.3 基于遗传-模糊高斯混合模型的优化 |
6.4 仿真实验 |
6.5 本章小结 |
第七章 基于自适应小生境遗传算法的说话人识别 |
7.1 概述 |
7.2 小生境技术 |
7.3 基于自适应小生境遗传算法的说话人识别 |
7.3.1 混合操作 |
7.3.2 参数的自适应策略 |
7.3.3 可区分性的适应度评价函数 |
7.3.4 解的编码方法及群体初始化 |
7.3.5 自适应小生境遗传算法的模型优化 |
7.4 仿真实验 |
7.5 本章小结 |
第八章 全文总结 |
8.1 主要工作与结论 |
8.2 今后研究的问题 |
参考文献 |
攻读博士学位期间发表的学术论文及科研工作 |
致谢 |
摘要 |
Abstract |
(8)基于模糊聚类神经网络的语音识别方法(论文提纲范文)
1 引 言 |
2 模糊聚类神经网络 (FCNN) |
2.1 矢量T-S模糊系统模型 |
2.2 改进的模糊聚类辨识算法 |
2.3 FCNN网络结构 |
2.4 FCNN的全局逼近性 |
2.5 FCNN网络的训练算法 |
3 语音识别系统的声学模型 |
4 实验结果 |
4.1 聚类类别数c对识别性能的影响 |
4.2 状态数L对识别性能的影响 |
4.3 输入矢量的帧数对识别性能的影响 |
4.4 非特定人 (SI) 连续音节识别系统性能的测试 |
4.5 非特定人 (SI) 连续数码串识别系统性能的测试 |
5 结 论 |
四、语音识别中基于模糊聚类分析的参数聚类(论文参考文献)
- [1]面向风格数据的模糊聚类以及模糊深度学习方法研究[D]. 顾苏杭. 江南大学, 2020(03)
- [2]模糊TSK系统的深度集成研究[D]. 张雄涛. 江南大学, 2019(05)
- [3]机载环境下的语音识别关键技术的研究[D]. 吴鹏. 安徽工业大学, 2019(02)
- [4]基于图像序列的嘴唇分割算法研究[D]. 武利娟. 上海交通大学, 2016(04)
- [5]语音识别中基于模糊聚类分析的参数聚类[J]. 徐向华,朱杰,郭强. 上海交通大学学报, 2004(12)
- [6]基于粒子群的优化方法研究[D]. 杨凤芹. 吉林大学, 2009(08)
- [7]基于模糊聚类与遗传算法的说话人识别理论研究及应用[D]. 林琳. 吉林大学, 2007(03)
- [8]基于模糊聚类神经网络的语音识别方法[J]. 刘宇红,刘桥,任强. 计算机学报, 2006(10)
- [9]一种基于模糊聚类分析的异音混合共享模型[J]. 徐向华,朱杰,郭强. 声学学报, 2005(05)
- [10]FCMBP聚类法在语音识别和模糊控制中的应用[J]. 何清,徐树富,王加银,史忠植. 系统工程学报, 2001(06)