这页简介计算机视觉(Computer Vision)正如我国计算机视觉先驱/科技部常务部长马颂德在下面第2本书的序说几乎所有应用数学分支都要到计算机视觉领域来一显身手,,事实上,这反映了当前的许多数学工具还不能有效解决…鲁棒性。然,基于几何的视觉方法,90年代发展到了几乎完美的程度。如此,下面第1中国计算机学会理事长的计算机视觉书就引用海南琼州大学的导师钟集教授的名著高等几何》中国自考委全国3个主任丁石孙、王斯雷、钟集教授就分别从事代数分析几何---数学常划分为这三大类

在国外被视为计算机视觉发端的事件是:1966MITMarvin Minsky让他的本科生Gerald Jay Sussman“在暑假将摄像机连到计算机上(这Gerald Jay Sussman1985年合写世界名著《Structure and Interpretation of Computer Programs计算机程序的构造和解释》他最近又合写Functional Differential Geometry泛函微分几何Sussman2个导师是Seymour Papert和人工智能之父明斯基--2个导师在1969年合作出版在人工智能等具有划时代意义Perceptrons: An Introduction to Computational Geometry感知器:计算几何导论》(象数学类的《美国数学公报》也评论这书,这第一导师Seymour Papert就是和我们海南琼大的导师钟集教授合创中国组合数学研究会的徐利治教授的师弟-不过徐教授在我国一解放就赶紧从剑桥大学回国没待读完博士--即曾来信邀请我去的徐利治教授的这个师弟Seymour Papert不仅是数学家也是人工智能先驱另外和谷歌研究总监Norvig1995年一经出版的《Artificial Intelligence: A Modern Approach人工智能:一种现代的方法》就成各国名校人工智能首选用书的Stuart Russell-其导师Genesereth的导师Joel Moses也是徐利治教授的师弟和明斯基共同的博士;再说Google创始人Larry Page佩奇的导师就如其在本科母校演讲说到他的导师是Terry Winograd-Google创始人的这导师也是徐利治教授的师弟Seymour Papert独立指导的博士[这徒孙 Page读博士生的宿舍基本上变成了Google的运营中心,最终Google诞生在宿舍,而且Google发家法宝PageRank就以Page名之,其实这里可知PageRankPage(佩奇)改进的一个在此之前海南琼州大学曾世界领先的图论算法--可见世界第一企业Google的创立几乎只靠徐利治教授的师弟的徒孙Page一人]--再附美国国家公共电视台主持人Ira Flatow最近2014主持的关于徐利治教授的师弟Seymour Papert的思考1讲话的是Flatow2个介绍Papert的是日本人Joi Ito、第3个是家人、第4个是尼葛洛庞帝、第5个是Scratch之父、第6批是创客教父4人座论、第7个是演员Sherry Turkle、第8个是美国参议员Angus King94人、第10个是2003年图灵奖得主Alan Kay、第11批全国杰出数学教学中心总裁Celia Hoyles也是ICMI首届获得者4人、第12个是全球六大疯狂计划的Danny Hillis等共5多小时:

近些年来计算机视觉产业链全局已渐庞大-可搜计算机视觉公司/图像识别公司/人脸识别公司--更具体地给出它们在这里。就此,下面列出我身边有的十几本国内外有影响的计算机视觉图像处理书籍:

1国内的-清华大学出版社出版的高文院士计算机视觉(这书引用华人的参考文献只有8-其中有海南琼州大学的导师钟集教授独立撰写的名著高等几何》且是高文院士这书的唯一数学参考书--如除钟集教授的数学书外其它7个引文是荆其诚院士的《人类的视觉》一书,控制论创刊主编们合写的书,和江泽民/杨振宁的老师合作的前辈合写的书,复旦大学的滤波图像书,还有我国AI创始人之一的我国主编的第一部书[他的AI一书1980年被许多大学传抄时我国AI学会还没成立],以及高文院士的全国唯一计算机应用重点学科的2篇博士论文,这本图像理解书是日本的),这计算机视觉的作者高文院士除了担任中国科学院研究生院常务院长/中国科技大学副校长外还是中国计算机学会理事长,陈熙霖

2国外的-计算机视觉中的多视图几何,作者是Richard HartleyAndrew ZissermanRichard Hartley是澳大利亚科学院院士Andrew Zisserman计算机科学被引中高排名9居全球计算机视觉专家之首,他的3个博士之一M. Pawan Kumar就做计算机视觉的组合最优化如浙工大说计算机视觉图论模型推理的论文得到牛津大学M. Pawan Kumar副教授的悉心指导Zisserman“最具影响力计算机科学作者50名榜单-即搜狐网的这50榜单居第3-即除了前2个主要做机器学习外的第3人就是这计算机视觉大师Andrew Zisserman, 他还被称为欧洲计算机科学家第一人,在当今全球前10的计算机科学家中他居第4--前3人是全都主要做机器学习的图灵奖得主,这些也许仅是某些方面的统计结果或看法。但他在计算机视觉的视觉几何、目标识别、可视化搜索等做出先驱性的伟大工作)  

   3Three-dimensional computer vision: A geometric viewpoint (计算机视觉的几何观点),作者:Olivier Faugeras(他是上面科技部副部长马颂德的博士导师,其重要如中国首富马化腾的腾讯人工智能实验室主任张正友说:几何视觉刚开始兴起。有两位代表人物,一位是法国的 Olivier Faugeras,另一位是下面我说有他主编的几本书的黄煦涛)。我就有Olivier Faugeras导师的导师-现代电路理论鼻祖即对电子电工电路贡献最大的人Ernst A. Guillemin吉耶曼的世界名著《电路理论引论》和《电路分析的数学-这数学主要是图论-电路几乎就是图论的抽象

   4Robot Vision机器人视觉,作者:Berthold K. P. Horn(Horn人工智能之父明斯基的博士Horn的博士Marc Raibert全球领先机器人公司-波士顿动力公司创办人)

   5Motion and Structure from Image Sequences,作者:Juyang Weng翁巨扬和他的2个博士导师Thomas S. Huang(黄煦涛), Narendra Ahuja合写(华人计算机视觉宗师Thomas S. Huang黄煦涛的导师William F. Schreiber的导师Harry Rowe Mimno就是我曾百次去学的东方麻省理工”的实际统帅冯秉铨教授的师兄弟

   6The Geometry of Multiple Images,作者:上面科技部副部长马颂德的博士导师Olivier FaugerasQuang-Tuan Luong. 

   最近出版的下面几本也已很有影响:

   7计算机视觉:一种现代方法,作者:David A. ForsythJean Ponce,林学訚等译(好象最近已出版第2版)

   8《计算机视觉:算法与应用》,作者是Richard Szeliski被引居62,他读博时Geoffrey Hinton正在该系并据说是其导师之一)

   9An Invitation to 3-D Vision: From Images to Geometric Models,作者:Yi Ma即马毅入选《科学》杂志排名的“最具影响力计算机科学作者”前50榜单--这榜单的第3人是上面计算机视觉大师Andrew Zisserman,排在第一位的是独立撰写世界名著《图论模型学习》的这里人工智能部分说的Michael I. Jordan和第二是后起之秀Andrew Ng吴恩达-并近年来都主要做机器学习特别是深度学习,4做自然语言处理的Christopher Manning,5是做计算机视觉的Jitendra Malik,6是刚获诺贝尔奖的Geoffrey Hinton,7是和几个组合最优化大师都合作的Scott Shenker,8是德国专家Bernhard Scholkopf,9这里1图论博士Jon Kleinberg,另一华人David Tse谢雅正排名11--显然这仅是一家之言-当然它有它的角度-即它是《科学》(Science)杂志依据Semantic Scholar排出-并感到也有一定的代表性), 和马毅合写这书的另3人是:Stefano Soatto(其是在边缘检测、图像分割和形状匹配做出关键工作的上面第5Jitendra Malik的徒孙), Jana Kosecká(人工智能之父McCarthy麦卡锡的徒孙), Shankar Sastry博士论文做电路和系统并也是上面Ernst A. Guillemin的徒孙(SastryCS被引排名50他的华人博士有马毅/泽湘/尔维/立成/新燕)   

   10还有这书也非常著名[已出第4还是第5]《图像处理,分析与机器视觉》的其中2作者Milan Sonka, Vaclav HlavacMGP查不到他俩, 但另一作者Roger Boyle图论博士。 也可参考很好的基础书Pattern Recognition and Machine LearningChristopher Bishop

 

   11-19从上面高文院士的书的引文也知数字信号与图像处理是计算机视觉的重要基础且不少是主要内容,如此,我有许多数字信号与图像处理书籍-如我有排在180的美国工程院院士Alan S. Willsky2本书(一本由常迵院士翻译,我也有程民德院士主编的《图象识别导论》-他俩同任中国图象图形学学会首届理事长)/Alan V. Oppenheim2本并其中一本他俩合写/黄煦涛院士主编的2本图像处理书/以及排名28H. Vincent Poor,也有Anil K. Jain的《数字图像处理基础》和Sanjit K. Mitra院士的《数字信号处理》/上面翁巨扬的第2导师的导师Azriel RosenfeldAvinash Kak的《数字图像处理》等等, 这领域也几乎就是数学即其大量地讲各类傅里叶变换/拉普拉斯变换/Z变换等等 

   评价海南琼州大学国际一流的诒勋教授翻译Bernhard Korte这里说当今世界第一名著组合最优化:理论与算法》之作用如见·茨和谷歌的论文只唯一做这领域--还如这Bernhard Korte2005年刚毕业的Christian Szegedy的博士论文就做它的加权组合数学拉普拉斯谱算子且已在这个人工智能全球最具影响力学者中居世界第5他的几个师兄更厉害-Christian SzegedyCV论文如Rethinking the Inception Architecture for Computer Vision是当今最有影响的论文之一/他的这篇论文Going Deeper with Convolutions影响更大等等)可见有空还要多攻读其它更多相关领域特别是他的导师的组合最优化》的某些领域可能具有独特的作用(也如这个人工智能全球最具影响力学者中居世界第2Alexander J. Smola1998年才毕业又他的博士Le Song宋乐于2008才毕业但宋乐在2017 NIPS大会发文数全球前3/2018 ICML发表8篇论文可能是世界第一/宋乐是2019 ICLR七位特邀发言人之一(且发言人也有韩家炜主霸的数据挖掘已是第一人Jure Leskovec并也就做图论神经网络)/刚又见宋乐并列 2020 ICLR世界第二--而在百度搜索宋乐教授见他全做图论,且宋乐的在人工智能居世界第2的上面导师Alexander J. Smola的导师Shawe-Taylor的博士论文就做图论。正如这里说图论神经网络也许是人工智能的未来)。 参看AAAI Fellow。 附:近些年来出现的我国部分计算机视觉公司和领军人才