条件随机场(Conditional random field)是一种基于判别式概率模型的序列标注方法,由John LaffertyTom M. Mitchell的博士Andrew McCallum以及Fernando Pereira Lafferty等人于2001年提出。该模型结合了马尔可夫随机场与逻辑回归的特点,采用链式结构建模序列数据的条件概率分布,支持全局特征归一化并克服了隐马尔可夫模型的输出独立性假设局限。广泛应用于自然语言处理(词性标注、命名实体识别)和生物序列分析(基因识别)等领域。

线性链条件随机场通过Viterbi算法进行解码,需设计特征函数描述输入序列与状态序列的关系。2002Taskar提出通用型CRF2004Sutton扩展出动态条件随机场以支持多标签任务。在计算机视觉领域,CRF用于优化图像分割结果。模型存在训练参数多、计算复杂度高等局限性

即条件随机域(场)(conditional random fields,简称 CRF,或CRFs),是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。 [1]条件随机场是条件概率分布模型 P(Y|X) ,表示的是给定一组输入随机变量 X 的条件下另一组输出随机变量 Y 的马尔可夫随机场,也就是说 CRF 的特点是假设输出随机变量构成马尔可夫随机场。条件随机场可被看作是最大熵马尔可夫模型在标注问题上的推广。

如同马尔可夫随机场,条件随机场为具有无向的图模型,在条件随机场中,随机变量Y 的分布为条件机率,给定的观察值则为随机变量 X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链结式的架构,链结式架构不论在训练(training)、推论(inference)、或是解码(decoding)上,都存在效率较高的算法可供演算。条件随机场是一个典型的判别式模型,其联合概率可以写成若干势函数联乘的形式,其中最常用的是线性链条件随机场

条件随机场已有一些重要的应用,如被用于中文分词和词性标注等词法分析工作,一般序列分类模型常常采用隐马尔可夫模型(HMM),像基于类的中文分词。

假设我们有Bob一天从早到晚的一系列照片,Bob想考考我们,要我们猜这一系列的每张照片对应的活动,比如: 工作的照片,吃饭的照片,唱歌的照片等等。一个比较直观的办法就是,我们找到Bob之前的日常生活的一系列照片,然后找Bob问清楚这些照片代表的活动标记,这样我们就可以用监督学习的方法来训练一个分类模型,比如逻辑回归,接着用模型去预测这一天的每张照片最可能的活动标记。这种办法虽然是可行的,但是却忽略了一个重要的问题,就是这些照片之间的顺序其实是有很大的时间顺序关系的,而用上面的方法则会忽略这种关系。比如我们现在看到了一张Bob闭着嘴的照片,那么这张照片我们怎么标记Bob的活动呢?比较难去打标记。但是如果我们有Bob在这一张照片前一点点时间的照片的话,那么这张照片就好标记了。如果在时间序列上前一张的照片里Bob在吃饭,那么这张闭嘴的照片很有可能是在吃饭咀嚼。而如果在时间序列上前一张的照片里Bob在唱歌,那么这张闭嘴的照片很有可能是在唱歌。

为了让我们的分类器表现的更好,可以在标记数据的时候,可以考虑相邻数据的标记信息。这一点,是普通的分类器难以做到的。而这一块,也是CRF比较擅长的地方。在实际应用中,自然语言处理中的词性标注(POS Tagging)就是非常适合CRF使用的地方。词性标注的目标是给出一个句子中每个词的词性(名词,动词,形容词等)。而这些词的词性往往和上下文的词的词性有关,因此,使用CRF来处理是很适合的,当然CRF不是唯一的选择,也有很多其他的词性标注方法。可参考牛津大学Steffen Lauritzen教授独撰的298页的《Graphical models图论模型》一书. Oxford: Clarendon Press1996年(他在1983年就和哈佛博士Nanny Wermuth合作图论模型和递归模型的论文,在美国数学评论更见他其后的1989年更是独撰或合作4篇图论模型的论文)。

化学热力学:最近, 国家最高科学技术奖获得者徐光宪院士说化学有三大理论成就:第一是这页要讲的化学热力学,其可以判断化学反应的方向,提出化学平衡和相平衡理论

化学热力学是建立在三个基本定律基础上发展起来的。即化学热力学的核心理论有三个:所有的物质都具有能量,能量是守恒的,各种能 化学实验 化学实验 量可以相互转化;事物总是自发地趋向于平衡态;处于平衡态的物质系统可用几个可观测量描述。

北大韩德刚教授和高执棣教授撰写的化学热力学的第一章是:基本概念和热力学第零定律热力学第零定律,又称热平衡定律,是热力学的四条基本定律之一,是一个关于互相接触的物体在热平衡时的描述,以及为温度提供理论基础。最常用的表述是:“若两个热力学系统均与第三个系统处于热平衡状态,此两个系统也必互相处于热平衡”。换句话说,第零定律是指:在一个数学二元关系之中,热平衡是递移的。

第零定律是由哈密顿图的现代开拓师祖Dirac的父亲的导师Ralph Howard Fowler拉尔夫·福勒于1939年正式提出,比热力学第一定律和热力学第二定律晚了80余年,但是第零定律是后面几个定律的基础,所以叫做热力学第零定律。即热力学第零定律的提出在热力学领域有着重要的意义: 第一,为比较两个物体是否处于热平衡提供了方法。第二,为温度概念的提出提供了实验基础,并为温度的测量提供了理论根据。因此热力学第零定律是热力学的基础。)

韩德刚,高执棣撰写的化学热力学的第二章是:热力学第一定律。

韩德刚,高执棣撰写的化学热力学的第三章是:热力学第二定律。

相关内容也可参看我很早就已购买的全国人大常委会副委员长严济慈院士独撰的热力学第一和第二定律因它主要是讲这2定律所以这书主要讲热力学定律以及可用能和热力学定律的应用)其后各章主要是涉及对上面定律的应用).

韩德刚,高执棣撰写的化学热力学的第七章是:热力学第三定律。

相关内容也可参考我也有的杨振宁和李政道的老师王竹溪院士的《热力学》第一版内容是:第一章:温度,第二章是:热力学第一定律,第三章是:热力学第二定律,第四章是:热力学第一定律,,第八章是:热力学第三定律,第九/十章重力场与弹性固体及热力学方法论。第二版再增加一章)

(由于统计物理是用微观的分子热运动去解释热力学的定律,如此热力学和统计物理常合在一起写,如被誉为中国物理学之父又是杨振宁和李政道的恩师的吴大猷的《热力学,气体运动论及统计力学等等,而不和热力学合写的《统计物理》或《统计力学》也常含有足够的热力学内容,如我早就有化学唐有祺院士独撰的《统计力学及其在物理化学中的应用》,也为了评论这里的2个很伟大的诺贝尔奖得主的重要工作,我也购买王竹溪院士的《统计物理学导论》-记不太清了即不知是否我更早就已有王竹溪院士这书?。总之, 统计物理或统计力学因是对粒子现象的统计,这就和肉眼可观测的宏观世界中的数学统计有很大差别,即少量粒子的统计是很找到合适的数学方法去进行近似求解如此,统计物理研究的是几乎无穷多个(1023)粒子的力学系统这是和数理统计是很不同的)