1. 首页
  2. > 银行开户 >

基于滤波器组的纹理分类研究(一阶滤波器设计及理论分析)

整理下计算机视觉、计算机图像、计算机图形等相关的几门科学技术的知识,方便对比学习,避免混淆。


图1 八个计算机视图相关学科分类


对主要知识和应用的归纳总结:


图2 计算机视图代表性学科知识结构与应用


图3 计算机视图代表性学科知识结构与应用


以下是基于参考资料的关键技术框架整理。


******************************************************************************


一、数字图像处理

(一) 生理视觉基础


人眼特性、色彩空间、多通道特性、亮度自适应、对比度敏感度函数(CSF)、视觉掩盖效应、立体视觉的形成过程、立体视觉系统的生理特性、立体视觉系统的心理特性、立体视觉生理特性与心理特性的关系、JND模型与显著性模型、JND模型、显著性模型


(二) 数字图像处理


1. 图像处理基础


a) 图像(表示和显示、空间分辨率和幅度分辨率、图像质量、数字化(采样、量化)、图像性质(度量、拓扑、直方图、熵、视觉感知、品质、噪声))


b) 图像工程(图像技术和图像工程、层次、相关学科和领域、技术应用、文献统计分类)


c) 图像处理系统(框图、采集、显示和打印、存储)


d) 色彩原理和分析


e) 摄像机(光敏、黑白、彩色)


f) 图像数据结构(表示层次、矩阵、链、拓扑、关系结构、分层结构)


2. 图像增强


g) 空域增强-点操作(坐标变换——基本坐标变换、坐标变换扩展;图像间运算——算术和逻辑运算、图像间算术运算应用;图像灰度映射——灰度映射原理、典型灰度映射;直方图变换——直方图均衡化、直方图规定化)


h) 空域增强-模板操作(像素间联系——邻域和邻接、连接和连通、像素间距;模板运算;线性滤波——线性平滑滤波、线性锐化滤波;非线性滤波——非线性平滑滤波、非线性锐化滤波、线性和非线性混合滤波;局部增强)


i) 频域图像增强(频域技术原理;傅里叶变换——2D傅里叶变换、傅里叶变换定理、快速傅里叶变换;低通和高通滤波;带通和带阻滤波;同态滤波;亮度成像模型;同态滤波增强)


3. 图像恢复


a) 图像消噪和恢复(图像退化及模型——退化示例、退化模型;噪声滤除——噪声描述、噪声概率密度函数、均值类滤波器、排序类统计滤波器、选择性滤波器;无约束恢复——无约束恢复公式、逆滤波;有约束恢复——有约束恢复公式、维纳滤波器、有约束最小平方恢复;交互式恢复)


b) 图像校正和修补(图像仿射变换——一般仿射变换、特殊仿射变换、变换间的联系;几何失真校正——空间变换、灰度插值;图像修复——修补原理、全变分模型、混合模型;区域填充——基于样本的方法、结合稀疏表达的方法)


c) 图像去雾(暗通道先验去雾算法及改进——基本方法、尺度自适应、透射率估计、大气光区域确定、大气光值校正、浓雾图像去雾;改善失真的综合算法——改进算法流程、空间转换 、 透射率分析空间的大气散射图、天空区域检测、对比度增强;去雾效果评价——可见边缘梯度法、 基于视觉感知的评价、主客观结合的评价实例)


d) 图像投影重建(投影重建方式——透射断层成像、发射断层成像、反射断层成像、电阻抗断层成像、磁共振成像;投影重建原理——基本模型、拉东变换、傅里叶反变换重建;逆投影重建——逆投影重建原理、卷积逆投影重建、其他逆投影重建方法;迭代重建——迭代重建模型、代数重建技术、最大似然-最大期望重建算法;综合重建方法)


4. 图像编码


a) 图像编码基础(图像压缩原理——数据冗余、图像编解码、图像保真度和质量;编码定理——信息单位和信源描述、无失真编码定理、率失真编码定理;位平面编码——位平面的分解、位平面的编码;变长编码——哥伦布编码、哈夫曼编码、香农-法诺编码、算术编码)


b) 图像变换编码——可分离和正交图像变换;离散余弦变换;正交变换编码——正交变换编码系统、子图像尺寸选择、变换选择、比特分配;小波变换——小波变换基础、1-D小波变换、快速小波变换、2-D小波变换、小波变换编码——小波变换编解码系统—— 基于提升小波的编码)


c) 更多图像编码方法(基于符号的编码;LZW 编码;预测编码——无损预测编码、有损预测编码;矢量量化;准无损编码;比较和评述——不同方法特性的比较、其他编码方法)


5. 图像处理应用技术


a) 图像信息安全(水印原理和特性——水印的嵌入和检测、水印特性、水印分类;DCT域图像水印——无意义水印算法、有意义水印算法;DWT 域图像水印——人眼视觉特性 、 小波水印算法;水印性能评判——失真测度、基准测量和攻击、水印性能测试示例、图像认证和取证——基本概念、图像被动取证、图像可逆认证、图像取证示例、图像反取证;图像信息隐藏——信息隐藏技术分类、基于迭代混合的图像隐藏)


b) 彩色图像处理(彩色视觉和色度图——彩色视觉基础、三基色与色匹配、色度图;彩色模型——面向硬设备的彩色模型、面向视觉感知的彩色模型;伪彩色增强;真彩色处理——处理策略、单分量变换增强、全彩色增强、全彩色滤波和消噪)


c) 视频图像处理(视频表达和格式——视频基础;彩色电视制式;运动分类和表达;运动检测——利用图像差的运动检、基于模型的运动检测、频率域运动检测;视频滤波—— 基于运动检测的滤波、基于运动补偿的滤波、消除匀速直线运动模糊;视频预测编码)

理论

d) 多尺度图像处理(多尺度表达;高斯和拉普拉斯金字塔——高斯金字塔、拉普拉斯金字塔、原始图像的重建;多尺度变换技术——类多尺度变换技术、多尺度变换技术比较; 基于多尺度小波的处理;超分辨率技术——基本模型和技术分类、基于单幅图像的超分辨率复原、基于多幅图像的超分辨率重建、基于示例的学习方法、基于稀疏表达的超分辨率重建、基于局部约束线性编码的超分辨率重建)


(三) 数字图像分析


1. 图像分析基础


图像分析;图像分析中的数字化——离散距离、连通组元、数字化模型、数字弧和弦;


距离变换——定义和性质、局部距离的计算、距离变换的实现


2. 图像分割


a) 图像分割基础(图像分割定义和技术分类;并行边界技术——边缘及检测原理、正交梯度算子、方向微分算子、二阶导数算子、边界闭合;串行边界技术——主动轮廓模型、 能量函数;并行区域技术——原理和分类、依赖像素的阈值选取、依赖区域的阈值选取、 依赖坐标的阈值选取、空间聚类;串行区域技术——区域生长、分裂合并)


b) 典型分割算法(兴趣点检测——二阶导数检测角点、最小核同值区算子、哈里斯兴趣点算子;图割方法;特色的阈值化和聚类技术——多分辨率阈值选取、借助过渡区选择阈值、借助均移确定聚类;分水岭分割算法——基本原理和步骤、算法改进和扩展


c) 分割技术扩展(从像素单元到目标单元——像素和目标之间的单元、椭圆目标检测; 从哈夫变换到广义哈夫变换——哈夫变换、广义哈夫变换原理、完整广义哈夫变换; 从像素到亚研究像素——基于矩保持的技术、利用


d) 一阶微分期望值的技术、借助切线信息的技术;从 2D图像到3D图像——3D边缘检测、3D图像阈值化;从灰度到彩色——彩色空间的选择、彩色图像分割策略


e) 分割评价比较(分割评价研究分类;分割算法评价框架;分割评价准则——分析法准则、优度试验法准则、差异试验法准则;算法评价实例——实验算法和图像、实验结果和讨论;评价方法和准则比较——方法讨论和对比、准则的分析比较、准则的实验比较;基于评价的算法优选系统——算法优选思想和策略、优选系统的实现和效果)


3. 表达描述


a) 目标表达(基于边界的表达——技术分类、链码、边界段、边界标志、多边形、地标点;基于区域的表达——技术分类、空间占有数组、四叉树、金字塔、围绕区域、 骨架;基于变换的表达——技术分类、傅里叶变换表达)


b) 目标描述(基于边界的描述——简单边界描述符、形状数、边界矩;基于区域的描述——简单区域描述符、拓扑描述符、区域不变矩;对目标关系的描述——目标标记和计数、点目标的分布、字符串描述、、树结构描述)


c) 测量和误差分析(直接测度和间接测度;需区别的术语——准确性和精确性、模型假设和实际观察、4-连通和8-连通;影响测量误差的因素——误差来源、光学镜头分辨率、采样密度、分割算法、特征计设计算公式、综合影响、随机样本共识;误差分析)


4. 特性分析


a) 纹理分析(纹理研究概况;纹理描述的统计方法——灰度共生矩阵、基于共生矩阵的纹理描述符、基于能量的纹理描述符;纹理描述的结构方法——结构描述法基础、 纹理镶嵌、局部二值模式;纹理描述的频谱方法——傅里叶频谱、盖伯频谱;一种纹理分类合成方法;纹理分割——有监督纹理分割、无监督纹理分割)


b) 形状分析(形状定义和研究;平面形状的分类;形状特性的描述——形状紧凑性描述、形状复杂性描述;基于技术的描述——基于多边形的描述符、基于离散曲率的描述符;拓扑结构的描述;分形维数)


c) 运动分析(运动研究内容;运动目标检测——背分析景建模、光流场、特定运动模式的检测;运动目标分割——目标分割和运动信息提取、稠密光流算法、基于参数和模型的分割;运动目标跟踪——典型技术、子序列决策策略)


d) 显著性和属性(显著性概述;显著性检测;显著区域分割提取——基于对比度幅值、 基于对比度分布、基于最小方向对比度、显著目标分割和评价;属性描述概况;属性提取中的特征比较;属性应用——跨类目标分类、属性学习和目标识别、基于局部动作属性的动作分类)


5. 数学工具


a) 数学形态学:二值(基本集合定义;二值形态学基本运算——二值膨胀和腐蚀、二值开启和闭合、二值基本运算性质;二值形态学组合运算——击中-击不中变换、二值组合运算;二值形态学实用算法)


b) 数学形态学:灰度(灰度图像的排序;灰度形态学基本运算——灰度膨胀和腐蚀、灰度开启和闭合、灰度基本运算性质;灰度形态学组合运算;灰度形态学实用算法; 图像代数)


c) 图像识别(模式和分类;不变量交叉比——交叉比、非共线点的不变量、对称的交叉比函数、交叉比应用示例;统计模式识别——最小距离分类器、最优统计分类器、 自适应自举;感知机和支持向量机——感知机、支持向量机;结构模式识别——字符串结构识别、树结构识别)


(四) 图像理解


a) 图像理解基础


图像工程——展、基本概念和定义概括、图像技术发展情况回顾;图像理解及相关学科——图像理解、计算机视觉、其他相关学科、图像理解的应用领域;图像理解理论框架——马尔视觉计算理论、对马尔理论框架的改进、关于马尔重建理论的讨论、 新理论框架的研究;内容框架和特点


b) 采集表达


a) 摄像机成像(视觉过程;摄像机成像模型——基本摄像机模型、近似投影模式、一般摄像机模型、通用成像模型;摄像机标定——标定程序和参数、两级标定法;亮度成像——光度学和光源、从亮度到照度)


b) 压缩感知与成像(压缩感知概述;稀疏表达;测量矩阵及特性——采样/测量模型、测量矩阵特性;解码重构——重构原理、测量矩阵的校准、典型重构算法;稀疏编码与字典学习——字典学习与矩阵分解、非负矩阵分解、端元提取、稀疏编码;压缩感知的成像应用——单像素相机、压缩感知磁共振成像)


c) 深度信息采集(高维图像和成像方式——高维图像种类、本征图像和非本征图像、


、深度成像方式;双目成像模式——双目横向模式、双目会聚横向模式、双目轴向模式;深度图像直接采集——飞行时间法、结构光法、莫尔等高条纹法、深度和亮度图像同时采集; 显微镜3-D 分层成像——景深和焦距、显微镜3D成像、共聚焦显微镜3D 成像)


d) 3D景物表达(曲线和曲面的局部特征——曲线局部特征、曲面局部特征;3D表面表达——参数表达、表面朝向表达;等值面的构造和表达——行进立方体算法、 覆盖算法;从并行轮廓插值3D表面;3D实体表达——基本表达方案、广义圆柱体表达)


c) 景物重建


a) 立体视觉:双目(立体视觉模块;基于区域的双目立体匹配——模板匹配、立体匹配;基于特征的双目立体匹配——基本步骤、尺度不变特征变换、加速鲁棒性特征、 动态规划匹配;视差图误差检测与校正)


b) 立体视觉:多目(水平多目立体匹配——水平多目图像、倒距离;正交三目立体匹配——基本原理、基于梯度分类的正交匹配;多目立体匹配——任意排列三目立体匹配、正交多目立体匹配;亚像素级视差计算)


c) 景物恢复:多图像(单目景物恢复;光度立体学——景物亮度和图像亮度、表面反射特性和亮度、景物表面朝向、反射图和亮度约束方程、光度立体学求解;从运动求取结构——光流和运动场、光流方程求解、光流与表面取向、光流与相对深度)


d) 景物恢复:单图像(从影调恢复形状——影调与形状、亮度方程求解;纹理与表面朝向——单目成像和畸变、由纹理变化恢复朝向、检测线段纹理消失点、确定图像外消失点;由焦距确定深度;根据三点透视估计位姿)


d) 场景解释


a) 知识表达和推理(知识基础;场景知识——模型、属性超图、基于知识的建模;过程知识;知识表达——知识表达要求、知识表达类型、图像理解系统中的知识模块、 基本知识表达方案;逻辑系统——谓词演算规则、利用定理证明来推理;语义网; 产生式系统)


b) 广义匹配(匹配概述——匹配策略和类别、匹配和配准、匹配评价;目标匹配—— 匹配的度量、对应点匹配、字符串匹配、惯量等效椭圆匹配、形状矩阵匹配;动态模式匹配;关系匹配;图同构——图论简介、图同构和匹配;线条图标记)


c) 场景分析和语义解释(场景理解概述;模糊推理——模糊集和模糊运算、模糊推理方法;遗传算法图像解释——遗传算法原理、语义分割和解释;场景目标标记;场景分类——词袋/特征包模型、pLSA 模型、LDA 模型)


e) 研究示例


a) 多传感器图像信息融合(信息融合概述;图像融合——主要步骤、三个层次、效果评价;像素级融合方法——基本融合方法、融合方法的结合、小波融合时的最佳分解层数、压缩感知图像融合、像素级融合示例;特征级和决策级融合方法——贝叶斯法、证据推理法、粗糙集理论法)


b) 基于内容的图像和视频检索(图像和视频检索原理;视觉特征的匹配和检索——颜色特征匹配、纹理特征计算、多尺度形状特征、综合特征检索;基于运动特征的视频检索——全局运动特征、局部运动特征;视频节目分析和索引——新闻视频结构化、体育比赛视频排序、家庭录像视频组织;语义分类检索——基于视觉关键词的图像分类、高层语义与气氛)


c) 时空行为理解(时空技术;时空兴趣点;动态轨迹学习和分析——自动场景建模、 学习路径、自动活动分析;动作分类和识别——动作分类、动作识别;活动和行为建模——动作建模、活动建模和识别;主体与动作联合建模——单标签主体-动作识别、多标签主体-动作识别、主体-动作语义分割)


*********************纹理*******************************************************************


二、计算机视觉

《计算机视觉 一种现代方法》


第一部分图像生成


1.摄像机的几何模型


图像成像——针孔透视、弱透视、带镜头的照相机、人的眼睛;内参数和外参数——刚体变换和齐次坐标、内参数、外参数、透视投影矩、弱透视投影矩阵;照相机的几何标定——使用线性方法对照相机进行标定、使用非线性方法对照相机进行标定


2.光照及阴影


像素的亮度——表面反射、光源及其产生的效果、朗伯 镜面反射模型、面光源;阴影的估算——辐射校准和高动态范围图像、镜面反射模、对亮度和照度的推、光度立体技术:从多幅阴影图像恢复形状;对互反射进行建模——源于区域光在一个块上的照度、热辐射和存在性、互反射模型、互反射的定性性质;一个阴影图像的形状


3.颜色


人类颜色感知——颜色匹配、颜色感受体;颜色物理学——颜色的来源、表面颜色;颜色表示——线性颜色空间、非线性颜色空间;图像颜色的模型——漫反射项、镜面反射项;基于颜色的推论——用颜色发现镜面反射、用颜色去除阴影、颜色恒常性:从图像颜色获得表面颜色


第二部分早期视觉:使用一幅图像


4.线性滤波


线性滤波与卷积——卷积;移不变线性系统——离散卷积、连续卷积、离散卷积的边缘效应;空间频率和傅里叶变换——傅里叶变换;采样和混叠——采样、混叠、分类平滑和重采样;滤波器与模板——卷积与点积、基的改变;技术:归一化相关和检测模式——通过归一化相关检测手势的方法来控制电视机;技术:尺度和图像金字塔——高斯金字塔、多尺度表示的应用


5.局部图像特征


计算图像梯度——差分高斯滤波;对图像梯度的表征——基于梯度的边缘检测子、方向;查找角点和建立近邻——查找角点、采用尺度和方向构建近邻;通过SIFT特征和HOG特征描述近邻——SIFT特征、HOG特征;实际计算局部特征


6.纹理


利用滤波器进行局部纹理表征——斑点和条纹、从滤波器输出到纹理表征、实际局部纹理表征;通过纹理基元的池化纹理表征——向量量化和纹理基元、k均值聚类的向量量化;纹理合成和对图像中的空洞进行填充——通过局部模型采样进行合成、填充图像中的空洞;图像去噪、非局部均值、三维块匹配(BM3D)、稀疏编码学习、结果;由纹理恢复形状——在平面内由纹理恢复形状、从弯曲表面的纹理恢复形状


第三部分低层视觉:使用多幅图像


7.立体视觉


双目摄像机的几何属性和对极约束——对极几何、本征矩阵、基础矩阵;双目重构——图像矫正;人类立体视觉;双目融合的局部算法——相关、多尺度的边缘匹配、双目融合的全局算法——排序约束和动态规划、滑约束和基于图的组合优化;使用多台摄像机;应用:机器人导航


8.从运动中恢复三维结构


内部标定的透视摄像机——问题的自然歧义性、从两幅图像估计欧氏结构和运动、从多幅图像估计欧氏结构和运动;非标定的弱透视摄像机、问题的自然歧义性、从两幅图像恢复仿射结构和运动、从多幅图像恢复仿射结构和运动、从仿射到欧氏图像;非标定的透视摄像机——问题的自然歧义性、从两幅图像恢复投影结构和运动、从多幅图像恢复投影结构和运动、从投影到欧氏图像


第四部分中层视觉方法


9.基于聚类的分割方法


人类视觉:分组和格式塔原理;重要应用——背景差分、镜头的边界检测、交互分割、形成图像区域;基于像素点聚类的图像分割——基本的聚类方法、分水岭算法、使用k均值算法进行分割、均值漂移:查找数据中的局部模型、采用均值漂移进行聚类和分割;分割、聚类和图论——图论术语和相关事实、根据图论进行凝聚式聚类、根据图论进行分解式聚类


、归一化切割;图像分割在实际中的应用——对分割器的评估


10.分组与模型拟合


霍夫变换——用霍夫变换拟合直线、霍夫变换的使用;拟合直线与平面——拟合单一直线、拟合平面、拟合多条直线;拟合曲线;鲁棒性——M估计法、RANSAC:搜寻正常点;用概率模型进行拟合——数据缺失问题、混合模型和隐含变量、混合模型的EM算法、EM算法的难点;基于参数估计的运动分割——光流和运动、光流模型、用分层法分割运动;模型选择:哪个最好——利用交叉验证选择模型


11.跟踪


简单跟踪策略——基于检测的跟踪、基于匹配的平移跟踪、使用仿射变换来确定匹配;匹配跟踪、匹配摘要表征、流跟踪;基于卡尔曼滤波器的线性动态模型跟踪——线性测量值和线性动态模型、卡尔曼滤波、前向后向平滑;数据相关——卡尔曼滤波检测方法、数据相关的关键方法;粒子滤波——概率分布的采样表示、最简单的粒子滤波器、跟踪算法、可行的粒子滤波器、创建粒子滤波器中的粒子


第五部分高层视觉


12.配准


刚性物体配准——迭代最近点、通过关联搜索转换关系、应用:建立图像拼接;基于模型的视觉:使用投影配准刚性物体——验证:比较转换与渲染后的原图与目标图;配准可形变目标——使用主动外观模型对纹理进行变形、实践中的主动外观模型、应用:医疗成像系统中的配准


13.平滑的表面及其轮廓


微分几何的元素——曲线、表面;表面轮廓几何学——遮挡轮廓和图形轮廓、图像轮廓的歧点和拐点、Koenderink定理;视觉事件:微分几何的补充——高斯映射的几何关系、渐近曲线、渐近球面映射、局部视觉事件、双切射线流形、多重局部视觉事件、外观图


14.深度数据


主动深度传感器;深度数据的分割——分析微分几何学的基本元素、在深度图像中寻找阶跃和顶边、把深度图像分割为平面区域;深度图像的配准和模型获取、四元组设计、使用最近点迭代方法配准深度图像、多幅深度图像的融合;物体识别、使用解释树匹配分段平面表示的表面、使用自旋图像匹配自由形态的曲面;Kinect、特征、技术:决策树和随机森林、标记像素、计算关节位置


15.用于分类的学习


分类、误差和损失函数——基于损失的决策、训练误差、测试误差和过拟合、正则化、错误率和交叉验证、受试者工作特征曲线(ROC);主要的分类策略——示例:采用归一化类条件密度的马氏距离、示例:类条件直方图和朴素贝叶斯、示例:采用最近邻的非参分类器、示例:线性支持向量机、示例:核机器、示例:级联和Adaboost;构建分类器的实用方法——手动调整训练数据并提升性能、通过二类分类器构建多类分类器、求解SVM和核机器的方案


16.图像分类


构建好的图像特征——示例应用、采用GIST特征进行编码布局、采用视觉单词总结图像、空间金字塔、采用主分量进行降维、采用典型变量分析进行降维、示例应用:检测不雅图片、示例应用:材料分类、示例应用:场景分类;分类单一物体的图像——图像分类策略、图像分类的评估系统、固定类数据集、大量类的数据集、花、树叶和鸟:某些特定的数据集;在实践中进行图像分类——关于图像特征的代码、图像分类数据库、数据库偏差、采用众包平台进行数据库收集


17.检测图像中的物体


滑动窗口法——人脸检测、行人检测、边界检测;检测形变物体;物体检测算法的发展现状——数据库和资源


18.物体识别


物体识别应该做什么——物体识别系统应该做什么、目前物体识别的策略、什么是类别、选择:应该怎么描述;特征问题——提升当前图像特征、其他类型的图像特征;几何问题语义问题——属性和不熟悉、部分、姿态部件和一致性、块的意义:部分、姿态部件、物体、短语和场景


第六部分 应用与其他主题


19.基于图像的建模与渲染


可视外壳——可视外壳模型的主要元素、跟踪相交曲线、分割相交曲线、锥带三角化、结果、更进一步:雕刻可视外壳;基于贴片的多视立体视觉——PMVS模型的主要元素、初始特征匹配、扩张、过滤、结果;光场


20.对人的观察


隐马尔可夫模型、动态规划和基于树形结构的模型——隐马尔可夫模型、关于HMM的推理、通过EM拟合HMM、树形结构的能量模型;对图像中的人进行解析——图形结构模型的解析、估计衣服的表面;人的跟踪——为什么人的跟踪如此困难、通过表面进行运动跟踪、采用模板进行运动人体跟踪;从二维到三维:提升、在正视图进行重构、利用外貌进行精确重构、利用运动进行精确重构;行为识别——背景:人类运动数据、人体结构和行为识别、采用外貌特征识别人类行为、采用组合的模型识别人类行为


第21章图像搜索与检索


应用背景——应用、用户需求、图像查询的类别、什么样的用户使用图像采集;源自信息检索的基本技术——单词统计、单词统计的平滑、最近邻估计和哈希、文本排序;图像文件——没有量化的匹配、根据查询结果对图像进行排序、浏览与布局、图像浏览布局;对注释的图片预测——源于邻近文字的注释、源于整幅图的注释、采用分类器预测关联的单词、人名与人脸、通过分割生成标签;目前最先进的单词预测器——资源、方法比较、开放问题


第七部分 背景材料


第22章优化技术


线性最小二乘法——正则方程和伪逆、齐次方程组和特征值问题、广义特征值问题、示例:拟合平面上的一条直线、奇异值分解;非线性最小二乘法——牛顿方法:平方非线性方程组、牛顿方法:过约束的非线性方程组、高斯牛顿法和Levenberg-Marquardt法;稀疏编码和字典学习——稀疏编码、字典学习、监督字典学习;最小切/最大流问题和组合优化——最小切问题、二次伪布尔函数、泛化为整型变量




《计算机视觉:模型、学习和推理》


第一部分 概率


1. 概率概述


随机变量;联合概率;边缘化;条件概率;贝叶斯公式;独立性;期望


2. 常用概率分布


伯努利分布;贝塔分布;分类分布; 狄利克雷分布;一元正态分布;正态逆伽马分布;多元正态分布;正态逆维希特分布;共轭性


3.拟合概率模型


最大似然法;最大后验法;贝叶斯方法;算例1:一元正态分布、最大似然估计、 最大后验估计、贝叶斯方法;算例2:分类分布——最大似然法、最大后验法、贝叶斯方法


4. 正态分布


协方差矩阵的形式;协方差分解;变量的线性变换;边缘分布;条件分布;正态分布的乘积;变量改变


第二部分 机器视觉的机器学习


5.视觉学习和推理


计算机视觉问题;模型的种类—理论—判别模型、生成模型;示例1:回归——判别模型、生成模型;示例2:二值分类——判别模型、生成模型;应该用哪种模型;应用——皮肤检测、背景差分


6.复杂数据密度建模


正态分类模型、隐变量、期望最大化、混合高斯模型——混合高斯边缘化、基于期望最大化的混合模型拟合; t分布、学生t分布边缘化、拟合t分布的期望最大化;因子分析——因子分析的边缘分布、因子分析学习的期望最大化;组合模型;期望最大化算法的细节——期望最大化算法的下界、E步、M步;应用——人脸检测、目标识别、分割、正脸识别、改变人脸姿态(回归)、作为隐变量的变换


7.回归模型


线性回归——学习、线性回归模型的问题;贝叶斯线性回归——实际考虑、拟合方差;非线性回归——最大似然法、贝叶斯非线性回归;核与核技巧;高斯过程回归;稀疏线性回归;二元线性回归;相关向量回归;多变量数据回归;应用——人体姿势估计——位移专家


8.分类模型


逻辑回归——学习:最大似然估计、逻辑回归模型的问题;贝叶斯逻辑回归——学习; 推理;非线性逻辑回归; 对偶逻辑回归模型; 核逻辑回归;相关向量分类;增量拟合和boosting;分类树; 多分类逻辑回归;随机树、随机森林和随机蕨分类器;与非概率模型的联系;应用——性别分类、脸部和行人检测、语义分割、恢复表面布局、 人体部位识别


第三部分 连接局部模型


9.图模型


条件独立性;有向图模型;示无向图模型;有向图模型与无向图模型的对比;计算机视觉中的图模型;含有多个未知量的模型推理——求最大后验概率的解、求后验概率分布的边缘分布、最大化边缘、后验分布的采样;样本采样——有向图模型的采样、无向图模型的采样;学习——有向图模型的学习、无向图模型的学习


10.链式模型和树模型


链式模型——有向链式模的型、无向链式模型、模型的等价性、隐马尔可夫模型在手语中的应用;链式MAP推理;树的MAP推理;链式边缘后验推理——求解边缘分布、前向后向算法、置信传播、链式模型的和积算法;树的边缘后验推理;链式模型和树模型的学习;链式模型和树模型之外的东西;应用——手势跟踪、立体视觉、形象化结构、分割


11. 网格模型


马尔可夫随机场——网格示例、离散成对MRF图像去噪、二值成对马尔可夫随机场的MAP推理——最大流/最小割、MAP推理:二值变量;多标签成对MRF的MAP推理; 非凸势的多标签MRF;条件随机场;高阶模型;网格有向模型;应用——背景差分、 交互式分割、立体视觉、图像重排、超分辨率、纹理合成、合成新面孔


第四部分预处理


12. 图像预处理与特征提取


逐像素变换——白化、直方图均衡化、线性滤波、局部二值模式、纹理基元映射;边缘、角点和兴趣点——Canny边缘检测器、Harris角点检测器、SIFT检测器;描述子、直方图、SIFT描述子、方向梯度直方图、词袋描述子、形状内容描述子;降维——单数值近似、主成分分析、二元主成分分析、K均值算法


第五部分 几何模型


13. 针孔摄像机


针孔摄像机简介——归一化摄像机、焦距参数、偏移量和偏移参数、摄像机的位置与方向、全针孔摄像机模型、径向畸变;三个几何问题、问题1:学习外在参数、问题2:学习内在参数、问题3:推理3D世界点、解决问题;齐次坐标;学习外在参数;学习内在参数;推理3D世界点; 应用——结构光的深度、剪影重构


14.变换模型


二维变换模型——欧氏变换模型、相似变换模型、仿射变换模型、投影变换模型、增加不确定性;变换模型中的学习——学习欧氏参数、学习相似参数、学习仿射参数、学习投影参数;变换模型中的推理、平面的三个几何问题——问题1:学习外在参数、问题2:学习内在参数、问题3:与摄像机相关的3D位置推理;图像间的变换——单应性的几何特征、计算图像间的变换;变换的鲁棒学习——RANSAC、 连续RANSAC、PEaRL;应用——增强现实追踪、视觉全景


15. 多摄像机系统


双视图几何学理论——极线约束、极点;实矩阵、实矩阵的属性、实矩阵的分解;基础矩阵、基础矩阵的估计、8点算法;双视图重构的流程; 校正——平面校正、极面校正、校正后处理;多视图重构;应用——三维重构、图片浏览、立体图割


第六部纹理分 视觉模型


16. 形状模型


形状及其表示; snake模型——推理、snake模型中存在的问题;形状模板、推理、用迭代最近点算法进行推理;统计形状模型——学习、推理;子空间形状模型——概率主成分分析、学习、推理;三维形状模型;形状和外观的统计模型、学习、推理;非高斯统计形状模型、回归PPCA、高斯过程隐变量模型;铰接式模型;应用——三维形变模型、三维人体模型


17. 身份与方式模型


子空间身份模型——学习、推理、在其他识别任务中的推理、身份子空间模型的局限性;概率线性判别分析、学习、推理;非线性身份模型;非对称双线性模型、学习、推理;对称双线性和多线性模型、学习、推理、多线性模型;应用、人脸识别、纹理建模、动画合成


18. 时序模型


时序估计框架——推理、学习;卡尔曼滤波器——推理、改写测量合并阶段、推理总结、、滤波、时序和测量模型、卡尔曼基于滤波器的问题;扩展卡尔曼滤波器;无损卡尔曼滤波器、状态演化、测量合并过程;粒。


******************************************************************************


三、模式识别

1.导论


模式识别的重要性;特征、特征向量和分类器;有监督、无监督和半监督学习;MATLAB程序


2.基于贝叶斯决策理论的分类器


贝叶斯决策理论;判别函数和决策面; 正态分布的贝叶斯分类;未知概率密度函数的估计; 最近邻规则;贝叶斯网络


3.线性分类器


线性判别函数和决策超平面;感知器算法;最小二乘法;均方估计的回顾;逻辑识别;支持向量机


4.非线性分类器


异或问题、两层感知器、三层感知器、基于训练集准确分类的算法、反向传播算法、反向传播算法的改进、代价函数选择、神经网络大小的选择、仿真实例、具有权值共享的网络、线性分类器的推广、线性二分法中1维空间的容量、多项式分类器、径向基函数网络、通用逼近、概率神经元网络、支持向量机:非线性情况、超越SVM的范例、决策树、合并分类器、合并分类器的增强法、类的不平衡问题、


5.特征选择


预处理;峰值现象;基于统计假设检验的特征选择;接收机操作特性(ROC)曲线;类可分性测量;特征子集的选择;最优特征生成;神经网络和特征生成/选择;推广理论的提示;贝叶斯信息准则


6.特征生成I:线性变换


基本向量和图像;;Karhunen-Love变换;奇异值分解;独立成分分析;非负矩阵因子分解;非线性维数降低;离散傅里叶变换(DFT);离散正弦和余弦变换;Hadamard变换;Haar变换;回顾Haar展开式;离散时间小波变换(DTWT);多分辨解释;小波包;二维推广简介


7.特征生成II


区域特征;字符形状和大小的特征;分形概述;语音和声音分类的典型特征


8.模板匹配


基于最优路径搜索技术的测度;基于相关的测度;可变形的模板模型;基于内容的信息检索:


9.上下文相关分类


贝叶斯分类器;马尔可夫链模型;Viterbi算法;信道均衡;隐马尔可夫模型;状态驻留的HMM;用神经网络训练马尔可夫模型;马尔可夫随机场的讨论


10.监督学习


误差计算方法;探讨有限数据集的大小;医学图像实例研究;半监督学习


11.聚类


近邻测度;顺序算法——聚类算法的种类、顺序聚类算法、BSAS的改进、两个阈值的顺序方法;改进阶段;神经网络的实现;层次算法;合并算法;cophenetic矩阵;分裂算法;用于大数据集的层次算法;最佳聚类数的选择


聚类算法III:基于函数最优方法——混合分解方法、模糊聚类算法、可能性聚类、硬聚类算法、向量量化;基于图论的聚类算法、竞争学习算法、二值形态聚类算法 、边界检测算法、谷点搜索聚类算法、通过代价最优聚类(回顾)、核聚类方法、对大数据集的基于密度算法、高维数据集的聚类算法、其他聚类算法、聚类组合


16.聚类有效性


假设检验回顾、聚类有效性中的假设检验、相关准则、单独聚类有效性、聚类趋势


***********************************************************


四、计算机图形

1. 计算机图形学综述


图和表、计算机辅助设计、虚拟现实环境、数据可视化、教学与培训、计算机艺术、娱乐、图像处理、图形用户界面、小结


2. 计算机图形硬件


视频显示设备——刷新式CRT、光栅扫描显示器、随机扫描显示器、彩色CRT监视器、平板显示器、三维观察设备、立体感和虚拟现实系统;光栅扫描系统(视频控制器、光栅扫描显示处理器;图形工作站和观察系统;输入设备(键盘、 按键盒和旋钮、鼠标设备、跟踪球和空间球、操纵杆、数据手套、数字化仪、图像扫描仪、触摸板、光笔、语音系统;硬拷贝设备;图形网络;因特网上的图形


3. 计算机图形软件


坐标表示;图形功能;软件标准;其他图形软件包;OpenGL简介——基本的OpenGL语法、相关库、头文件、使用GLUT进行显示窗口管理、一个完整的OpenGL程序、OpenGL的出错处理


4. 输出图元


坐标系统——屏幕坐标、绝对和相对坐标描述;OpenGL中指定二维世界坐标系统; OpenGL画点函数;OpenGL画线函数;OpenGL曲线函数;填充区图元;多边形填充区——多边形分类、识别凹多边形、分割凹多边形、将凸多边形分割成三角形集、内-外测试、 多边形表、平面方程、前向面与后向面、OpenGL多边形填充区函数、OpenGL顶点数组; 像素阵列图元;OpenGL像素阵列函数——OpenGL位图函数、OpenGL像素图函数、 OpenGL光栅操作、字符图元;OpenGL字符函数;图形分割;OpenGL显示表——创建和命名OpenGL显示表、执行OpenGL显示表、删除OpenGL显示表;OpenGL显示窗口重定形函数;


5. 图元的属性


OpenGL状态变量;颜色和灰度——RGB颜色分量、颜色表、灰度、其他颜色参数;OpenGL颜色函数——OpenGL的RGB和RGBA颜色模型、OpenGL 颜色索引模式、OpenGL颜色调、OpenGL颜色数组、其他OpenGL颜色函数;点的属性;OpenGL点属性函数;线的属性——线宽、线型、画笔或画刷的选择;OpenGL线属性函数——OpenGL线宽函数、OpenGL线型函数、其他OpenGL线效果;曲线属性;填充区属性——填充模式、颜色调和填充区域;OpenGL填充区属性函数——OpenGL填充图案函数、OpenGL纹理和插值图案、OpenGL线框图方法、OpenGL前向面函数;字符属性;OpenGL字符属性函数; OpenGL反走样函数;OpenGL询问函数;OpenGL属性组


6. 实现图元及属性的算法


画线算法——直线方程、DDA算法、Bresenham画线算法、显示折线;并行画线算法;帧缓存值的及装载;圆生成算法——圆的特性、中点圆算法;椭圆生成算法——椭圆的特征、 中点椭圆算法;其他曲线——圆锥剖切线、多项式和样条曲线;并行曲线算法;像素编址和对象的几何要素——屏幕网格坐标、保持显示对象的几何特性;直线段和曲线属性的实现—— 线宽、线型、画笔或画刷的选项、曲线属性;通用扫描线填充算法;凸多边形的扫描线填充;曲线边界区域的扫描线填充;不规则边界区域的填充方法——边界填充算法、泛滥填充算法; 填充模式的实现方法——填充模式、颜色调和填充区域;反走样的实现方法——直线段的过取样、子像素的加权掩模、直线段的区域取样、过滤技术、像素移相、直线亮度差的校正、 区域边界的反走样


7. 二维几何变换


基本的二维几何变换——二维平移、二维旋转、二维缩放;矩阵表示和齐次坐标——齐次坐标、二维平移矩阵、二维旋转矩阵、二维缩放矩阵;逆变换;二维复合变换——复合二维平移、复合二维旋转、复合二维缩放、通用二维基准点旋转、通用二维基准点缩放、通用二维定向缩放、矩阵合并特性、通用二维复合变换和计算效率、二维刚体变换、构造二维旋转矩阵、二维复合矩阵编程例;其他二维变换——反射、错切;几何变换的光栅方法;OpenGL光栅变换;二维坐标系间的变换;OpenGL二维几何变换函数——基本的OpenGL几何变换、OpenGL矩阵操作;OpenGL几何变换编程示例;


8. 二维观察


二维观察流水线、裁剪窗口——观察坐标系裁剪窗口、世界坐标系裁剪窗口;规范化和视口变换——裁剪窗口到规范化视口的映射、裁剪窗口到规范化正方形的映射、字符串的显示、 分画面效果和多输出设备;OpenGL二维观察函数——OpenGL投影模式、GLU裁剪窗口函数、OpenGL视口函数、建立GLUT显示窗口、设定GLUT显示窗口的模式和颜色、GLUT显示窗口标识、删除GLUT显示窗口、当前GLUT显示窗口、修改GLUT显示窗口的位置和大小、管理多个GLUT显示窗口、GLUT子窗口、显示窗口屏幕光标形状的选择、在GLUT显示窗口中观察图形对象、执行应用程序、其他GLUT函数、OpenGL的二维观察程序例; 裁剪算法;二维点裁剪;二维线裁剪——Cohen-Sutherland线段裁剪算法、梁友栋-Barsky线段裁剪算法 、Nicholl-Lee-Nicholl线段裁剪算法、非矩形多边形裁剪窗口的线段裁剪、非线性裁剪窗口边界的线裁剪;多边形填充区裁剪——Sutherland-Hodgman多边形裁剪、 Weiler-Atherton多边形裁剪、非矩形的多边形窗口的多边形裁剪、非线性裁剪窗口边界的多边形裁剪;曲线的裁剪;文字的裁剪


9. 三维几何变换


三维平移;三维旋转——三维坐标轴旋转、一般三维旋转、三维旋转的四元数方法;三维缩放;三维复合变换;其他三维变换——三维反射、三维错切;三维坐标系间的变换;仿射变换;OpenGL几何变换函数——OpenGL矩阵栈、OpenGL几何变换编程例


10. 三维观察


三维观察概念综述——三维场景观察、投影、深度提示、可见线和可见面的判定、面绘制、 拆散和剖切面视图、三维和立体视图;三维观察流水线、三维观察坐标系参数——观察平面法向量、观察向上向量、uvn观察坐标系、生成三维观察效果;世界坐标系到观察坐标系的变换、投影变换、正投影——轴测和等轴测正投影、正投影坐标系、裁剪窗口和正投影观察体、正投影的规范化变换;斜投影——绘图和设计中的斜平行投影、斜等测和斜二测斜平行投影、斜平行投影向量、裁剪窗口和斜平行投影观察体、斜平行投影变换矩阵、斜平行投影的规范化变换;透视投影——透视投影变换坐标系、透视投影公式: 特殊情况、透视投影的灭点、透视投影观察体、透视投影变换矩阵、对称的透视投影锥体、斜透视投影棱台、规范化透视投影变换坐标;视口变换和三维屏幕坐标系;OpenGL三维观察函数——Op滤波器enGL观察变换函数、OpenGL正交投影函数、OpenGL对称透视投影棱台、OpenGL通用透视投影函数、OpenGL视口和显示窗口、OpenGL三维观察程序示例;三维裁剪算法——三维齐次坐标系中的裁剪、三维区域码、三维点和线的裁剪、三维多边形裁剪、三维曲面裁剪、


任意裁剪平面、OpenGL任选裁剪平面


11. 层次建模


基本建模概念——系统表示、符号层次;建模软件包;通用层次建模方法——局部坐标、建模变换、创建层次结构;使用OpenGL显示列表的层次建模


12. 计算机动画


计算机动画的光栅方法——双缓存、用光栅操作生成动画;动画序列的设计;传统动画技术;通用计算机动画功能;计算机动画语言;关键帧系统——变形、模拟加速度;运动的描述——直接运动描述、目标导向系统、运动学和动力学;角色动画——关节链形体动画、运动捕捉;周期性运动;OpenGL动画子程序


13. 三维对象的表示


多面体;OpenGL多面体函数——OpenGL多边形填充函数、GLUT规则多面体函数、GLUT多面体程序示;曲面;二次曲面——球面、椭球面、环面;超二次曲面——超椭圆、超椭球面;OpenGL二次曲面和三次曲面函数—— GLUT二次曲面函数、 OpenGL三次曲面茶壶函数、 GLU二次曲面函数、使用GLUT和GLU二次曲面函数的程序示例


14. 样条表示


插值和逼近样条;参数连续性条件;几何连续性条件;样条描述;样条曲面;修剪样条曲面 ;三次样条插值方法——自然三次样条、Hermite插值、Cardinal样条、Kochanek?Bartels样条;Bzier样条曲线——Bzier曲线公式、Bzier曲线生成程序示例、Bzier曲线的特性、使用Bzier曲线的设计技术、三次Bzier曲线;Bzier曲面; B样条曲线—— B样条曲线公式、 均匀周期性B样条曲线 、三次周期性B样条曲线、开放均匀的B样条曲线


、非均匀B样条曲线;B样条曲面;Beta样条—— Beta样条连续性条件、三次周期性Beta样条曲线的矩阵表示;有理样条;样条表示之间的转换;样条曲线和曲面的显示—— Horner规则、研究向前差分计算、细分方法;OpenGL的逼近样条函数——OpenGL的Bzier样条曲线函数、OpenGL的Bzier样条曲面函数、 GLU的B样条曲线函数、GLU的B样条曲面函数、GLU曲面修剪函数;


15. 其他三维对象的表示


柔性对象;扫描表示法;结构实体几何法;八叉树;BSP树;基于物理的方法


16. 可见面判别算法


可见面判别算法的分类;后向面判别;深度缓存算法;A缓存算法;扫描线算法;深度排序算法;BSP树算法;区域细分算法;八叉树算法;光线投射算法;可见性检测算法的比较;


曲面——曲面表示、曲面的层位线显示;线框图可见性算法——线框面可见性算法、线框图深度提示算法;OpenGL可见性检查函数——OpenGL多边形剔除函数、OpenGL深度缓存函数、OpenGL线框面可见性方法、OpenGL深度提示函数


17. 光照模型与面绘制算法


光源——点光源、穷远光源、辐射强度衰减、方向光源和投射效果、角强度衰减、扩展光源和Warn模型;表面光照效果;基本光照模型——环境光、漫反射、镜面反射和Phong模型、漫反射和镜面反射的合并、多光源的漫反射和镜面反射、表面的光发射、考虑强度衰减和高光的基本光照模型、RGB颜色考虑、其他颜色表示、亮度;透明表面——半透明材料、


光折射、基本的透明模型;雾气效果;阴影;照相机参数;光强度显示——分配系统强度等级、gamma校正与视频查找表、显示连续色调的图像;半色调模式和抖动技术——半色调近似、抖动技术;多边形绘制算法——恒定强度的明暗处理、Gouraud明暗处理、Phong明暗处理、快速Phong明暗处理、OpenGL光照和表面绘制函数 ——OpenGL点光源函数


、指定一个OpenGL光源位置和类型、指定OpenGL光源颜色、指定OpenGL光源的辐射强度衰减系数、OpenGL方向光源(投射光源)、OpenGL全局光照参数、OpenGL表面特性函数、OpenGL光照模型、OpenGL雾气效果、OpenGL透明性函数、OpenGL表面绘制函数、OpenGL半色调操作


18. 纹理与表面细节添加方法


用多边形模拟表面细节、纹理映射——线性纹理图案、表面纹理图案、体纹理图案、纹理缩减图案、过程式纹理映射方法;凹凸映射;帧映射;OpenGL纹理函数——线纹理函数、表面纹理函数、体纹理函数、纹理图案的颜色选项、纹理映射选项、纹理环绕、复制帧缓存中的OpenGL纹理图案、OpenGL纹理坐标数组、OpenGL纹理图案命名、OpenGL纹理子图案、OpenGL纹理缩减图案、OpenGL纹理边界、 OpenGL代理纹理、 二次曲面的自动纹理映射、齐次纹理坐标、 其他的OpenGL纹理选项


19. 颜色模型和颜色应用


光的特性——电磁频谱、颜色的心理学特征;颜色模型——基色、直观的颜色概念;标准基色和色度图——XYZ颜色模型、规范化的XYZ值、CIE色度图、颜色范围组、互补色、主波长、纯度;RGB颜色模型;YIQ颜色模型——YIQ参数、RGB颜色空间和YIQ颜色空间之间的转换、YUV和YCrCb系统;CMY和CMYK颜色模型——CMY参、CMY颜色空间和RGB颜色空间之间的转换;HSV颜色模型——HSV参数、选择明暗、 色泽和色调、HSV和RGB模型之间的转换;HLS颜色模型;颜色选择及其应用


20. 图形用户界面和交互输入方法


图形数据的输入;输入设备的逻辑分类; 图形数据的输入功能 ;交互式构图技术;虚拟现实环境;OpenGL支持交互式输入设备的函数 ;OpenGL的菜单功能; 图形用户界面的设计


21. 全局光照


光线跟踪方法;辐射度光照模型;环境映射;光子映射


22. 可编程着色器


着色语言的发展历史——Cook着色树、 Perlin像素流编辑器、RenderMan;OpenGL渲染流水线、固定功能流水线、改变流水线结构、顶点着色器、片元着色器、几何着色器、曲面细分着色器;OpenGL着色语言、着色器结构、在OpenGL中使用着色器、基本数据类型、矢量、矩阵、结构和数组、控制结构、GLSL函数、与OpenGL的通信;着色器效果


、一个Phong着色器、纹理映射、 凹凸映射


23. 基于算法的建模


分形几何方法、分形生成过程、分形分类、分形的维数、确定性自相似分形几何构造、统计自相似分形的几何构造、仿射分形构造方法、随机中点位移方法、地面图控制、自平方分形


、自逆分形;粒子系统;形状语法和其他过程方法


24. 数据集可视化


标量场的可视化表示;向量场的可视表示;张量场的可视表示;多变量数据场的可视表示


************************************************************************


五、知识图谱

1.知识图谱概述


什么是知识图谱;知识图谱的发展历史 ;知识图谱的价值;国内外典型的知识图谱项目——早期的知识库项目、互联网时代的知识图谱、中文开放知识图谱、垂直领域知识图谱、知识图谱的技术流程、知识图谱的相关技术、知识图谱与数据库系统、知识图谱与智能问答、知识图谱与机器推理、知识图谱与推荐系统、区块链与去中心化的知识图谱


2.知识图谱表示与建模


什么是知识表示;人工智能早期的知识表示方法——一阶谓词逻辑、霍恩子句和霍恩逻辑 、语义网络、框架、描述逻辑;互联网时代的语义网知识表示框架——RDF和RDFS、 OWL和OWL2 Fragments、知识图谱查询语言的表示、语义Markup表示语言 ;常见开放域知识图谱的知识表示方法——Freebase、Wikidata、ConceptNet5;知识图谱的向量表示方法 ——知识图谱表示的挑战、词的向量表示方法、知识图谱嵌入的概念、知识图谱嵌入的优点 、知识图谱嵌入的主要方法、知识图谱嵌入的应用;开源工具实践:基于Protg的本体知识建模——简介、环境准备、Protg实践主要功能演示


3.知识存储


知识图谱数据库基本知识——知识图谱数据模型 、知识图谱查询语言;常见知识图谱存储方法——基于关系数据库的存储方案、面向RDF的三元组数据库、原生图数据库、知识图谱数据库比较;知识存储关键技术——知识图谱数据库的存储:以Neo4j为例、知识图谱数据库的索引;开源工具实践——三元组数据库Apache Jena、面向RDF的三元组数据库gStore


4.知识抽取一阶与知识挖掘


知识抽取任务及相关竞赛——知识抽取任务定义、知识抽取相关竞赛;面向非结构化数据的知识抽取——实体抽取、关系抽取、事件抽取;面向结构化数据的知识抽取——直接映射 、R2RML、相关工具;面向半结构化数据的知识抽取 、面向百科类数据的知识抽取、面向Web网页的知识抽取;知识挖掘——知识内容挖掘:实体链接、知识结构挖掘:规则挖掘;开源工具实践:基于DeepDive的关系抽取实践——开源工具的技术架构、其他类似工具


5.知识图谱融合


什么是知识图谱融合;知识图谱中的异构问题——语言层不匹配、模型层不匹配;本体概念层的融合方法与技术——本体映射与本体集成、本体映射分类、本体映射方法和工具、本体映射管理、本体映射应用;实例层的融合与匹配——知识图谱中的实例匹配问题分析、基于快速相似度计算的实例匹配方法、基于规则的实例匹配方法、基于分治的实例匹配方法、基于学习的实例匹配方法、实例匹配中的分布式并行处理 ;开源工具实践:实体关系发现框架LIMES——简介、开源工具的技术架构、其他类似工具


6.知识图谱推理


推理概述——什么是推理、面向知识图谱的推理;基于演绎的知识图谱推理——本体推理 、基于逻辑编程的推理方法、基于查询重写的方法、基于产生式规则的方法;基于归纳的知识图谱推理——基于图结构的推理、基于规则学习的推理、基于表示学习的推理;知识图谱推理新进展——时序预测推理、基于强化学习的知识图谱推理、基于元学习的少样本知识图谱推理、图神经网络与知识图谱推理;开源工具实践:基于Jena和Drools的知识推理实践——开源工具简介、开源工具的技术架构、开发软件版本及其下载地址、基于Jena的及知识推理实践、基于Drools的知识推理实践


7.语义搜索


语义搜索简介、结构化的查询语言——数据查询 、数据插入、数据删除;语义数据搜索;语义搜索的交互范式——基于关键词的知识图谱语义搜索方法、基于分面的知识图谱语义搜索、基于表示学习的知识图谱语义搜索;开源工具实践——功能介绍、环境搭建及数据准备 、数据准备、导入Elasticsearch、功能实现、执行查询


8.知识问答


知识问答概述——知识问答的基本要素、知识问答的相关工作、知识问答应用场景;知识问答的分类体系、问题类型与答案类型、知识库类型、智能体类型;知识问答系统——NLIDB:早期的问答系统、IRQA:基于信息检索的问答系统、KBQA:基于知识库的问答系统、CommunityQA/FAQ-QA:基于问答对匹配的问答系统、Hybrid QA Framework 混合问答系统框架;知识问答的评价方法、问答系统的评价指标、问答系统的评价数据集;KBQA前沿技术——KBQA面临的挑战、基于模板的方法、基于语义解析的方法、基于深度学习的传统问答模块优化、基于深度学习的端到端问答模型 ;开源工具实践 ——使用Elasticsearch搭建简单知识问答系统、基于gAnswer构建中英文知识问答系统


9.知识图谱应用案例


领域知识图谱构建的技术流程——领域知识建模、知识存储、知识抽取、知识融合、知识计算、知识应用;领域知识图谱构建的基本方法——自顶向下的构建方法、自底向上的构建方法;领域知识图谱的应用案例——电商知识图谱的构建与应用、图情知识图谱的构建与应用 、生活娱乐知识图谱的构建与应用:以美团为例、企业商业知识图谱的构建与应用、创投知识图谱的构建与应用、中医临床领域知识图谱的构建与应用、金融证券行业知识图谱应用实践


***************************************************************************


六、数据科学

1.导论


数据科学的发展历史;数据科学研究的主要问题;数据科学的主要方法;R语言的优势 7


2.数据


数据对象与属性类型——什么是属性、标称属性、二元属性、序数属性、数值属性、离散属性与连续属性;数据的基本统计描述、中心趋势度量:均值、中位数和众数、度量数据散布:极差——四分位数、方差、标准差和四分位数极差、数据的基本统计描述的图形显示


数据的读入——直接输入数据、读入R包中的数据、从外部文件读入数据、批量读入数据、R语言读取文件的几个常错的问题;写出数据;


3.数据挖掘


数据库数据、数据仓库、事务数据;可以挖掘什么类型的模式——类/概念描述:特征化与区分、挖掘频繁模式、一阶关联和相关性、用于预测分析的分类与回归、聚类分析、离群点分析组、所有模式都是有趣的吗;使用什么技术——统计学、机器学习、数据库系统与数据仓库、信息检索;面向什么类型的应用——商务智能、Web搜索引擎;数据挖掘的主要问题——挖掘方法、用户界面、有效性和可伸缩性、数据库类型的多样性、数据挖掘与社会


3.数据清洗与预处理


数据分类;数据清洗——处理缺失数据、处理噪声数据;数据变换;R语言实现——数据集的基本操作、数据集间的操作、连接数据库数据;;数据质量:为什么要对数据预处理、数据预处理的主要任务;数据清理——缺失值、噪声数据;数据集成——实体识别问题、冗余和相关分析、元组重复、数据值冲突的检测与处理;数据归约——数据归约策略概述、小波变换、主成分分析、属性子集选择、回归和对数线性模型:参数化数据归约、直方图、聚类、抽样、数据立方体聚集;数据变换与数据离散化——数据变换策略概述、通过规范化变换数据、通过分箱离散化、通过直方图分析离散化、通过聚类、决策树和相关分析离散化、标称数据的概念分层产生


4.数据仓库与联机分析处理


数据仓库:基本概念——什么是数据仓库、操作数据库系统与数据仓库的区别、为什么需要分离的数据仓库、数据仓库:一种多层体系结构、数据仓库模型:企业仓库、数据集市和虚拟仓库、数据提取、变换和装入、元数据库;数据仓库建模:数据立方体与OLAP——数据立方体:一种多维数据模型、星形、雪花形和事实星座:多维数据模型的模式、维:概念分层的作用、度量的分类和计算、典型的OLAP操作、查询多维数据库的星网查询模型;数据仓库的设计与使用——数据仓库的设计的商务分析框架、数据仓库的设计过程、数据仓库用于信息处理、从联机分析处理到多维数据挖掘;数据仓库的实现——数据立方体的有效计算:概述、索引OLAP数据:位图索引和连接索引、OLAP查询的有效处理、OLAP服务器结构:ROLAP、MOLAP、HOLAP的比较;数据泛化:面向属性的归纳——数据特征的面向属性的归纳、面向属性归纳的有效实现、类比较的面向属性归纳




4.数据可视化


基于像素的可视化技术、几何投影可视化技术、基于图符的可视化技术、层次可视化技术、可视化复杂对象和关系;度量数据的相似性和相异性、数据矩阵与相异性矩阵、标称属性的邻近性度量、二元属性的邻近性度量、数值属性的相异性:闵可夫斯基距离、序数属性的邻近性度量、混合类型属性的相异性、余弦滤波器相似性;高阶绘图工具ggplot2、快速绘图、使用图层构建图像、分面;ECharts2


5.数据立方体技术


数据立方体计算:基本概念——立方体物化:完全立方体、冰山立方体、闭立方体和立方体外壳、数据立方体计算的一般策略;数据立方体计算方法——完全立方体计算的多路数组聚集、BUC:从顶点方体向下计算冰山立方体、Star-Cubing:使用动态星树结构计算冰山立方体、为快速高维OLAP预计算壳片段;使用探索立方体技术处理高级查询——抽样立方体:样本数据上基于OLAP的挖掘、排序立方体:top-k查询的有效计算;数据立方体空间的多维数据分析、预测立方体:立方体空间的预测挖掘、多特征立方体:多粒度上的复杂聚集、基于异常的、发现驱动的立方体空间探查


6.挖掘频繁模式、关联和相关性:基本概念和方法


基本概念、购物篮分析:一个诱发例子、频繁项集、闭项集和关联规则;频繁项集挖掘方法——Apriori算法:通过限制候选产生发现频繁项集、由频繁项集产生关联规则、提高Apriori算法的效率、挖掘频繁项集的模式增长方法、使用垂直数据格式挖掘频繁项集、挖掘闭模式和极大模式;哪些模式是有趣的:模式评估方法——强规则不一定是有趣的、从关联分析到相关分析、模式评估度量比较


7.高级模式挖掘


模式挖掘:一个路线图——多层、多维空间中的模式挖掘、挖掘多层关联规则、挖掘多维关联规则、挖掘量化关联规则、挖掘稀有模式和负模式、基于约束的频繁模式挖掘、关联规则的元规则制导挖掘、基于约束的模式产生:模式空间剪枝和数据空间剪枝、挖掘高维数据和巨型模式;挖掘压缩或近似模式、通过模式聚类挖掘压缩模式、提取感知冗余的top-k模式;


模式探索与应用——频繁模式的语义注解、模式挖掘的应用


5.线性回归


问题的提出;一元线性回归——一元线性回归概述、一元线性回归的参数估计、一元线性回归模型的检验、一分类元线性回归的预测;多元线性回归分析——多元线性回归模型及假定、参数估计、模型检验、预测;R语言实现 、一元线性回归、多元线性回归


6.线性分类


什么是分类、分类的一般方法;决策树归纳——决策树归纳、属性选择度量、树剪枝、可伸缩性与决策树归纳、决策树归纳的可视化挖掘;贝叶斯分类方法——贝叶斯定理、朴素贝叶斯分类;基于规则的分类——使用IF-THEN规则分类、由决策树提取规则、使用的顺序覆盖算法的规则归纳;模型评估与选择——评估分类器性能的度量、保持方法和随机二次抽样、交叉验证、自助法、使用统计显著性检验选择模型、基于成本效益和ROC曲线比较分类器;提高分类准确率的技术——组合分类方法简介、装袋、提升和AdaBoost、随机森林、提高类不平衡数据的分类准确率;Logistic模型——线性概率模型、Probit模型、 Logit模型原理、边际效应分析 、最大似然估计(MLE)、似然比检验 ;判别分析——Naive Bayes判别分析、线性判别分析、二次判别分析;分类问题评价准则;R语言实现——描述统计、Logistic模型、判别分析、模型比较


7.高级分类


 分类:高级方法;贝叶斯信念网络——概念和机制、训练贝叶斯信念网络;用后向传播分类——多层前馈神经网络、定义网络拓扑、后向传播、黑盒内部:后向传播和可解释性;支持向量机、数据线性可分的情况、数据非线性可分的情况;使用频繁模式分类——关联分类、基于有区别力的频繁模式分类;惰性学习法(或从近邻学习)、k-最近邻分类、基于案例的推理;其他分类方法——遗传算法、粗糙集方法、模糊集方法;关于分类的其他问题——多类分类、半监督分类、主动学习、迁移学习


7.重抽样


基本概念——训练误差和测试误差、偏差和方差;交叉验证法——验证集方法 、留一交叉验证法、 K折交叉验证法;自助法;R语言实现——验证集方法、留一交叉验证法、K折交叉验证法、自助法


8.模型选择与正则化


子集选择法——最优子集法、逐步选择法、模型选择;基于压缩估计的逐个变量选择、LASSO惩罚、 SCAD惩罚、M基于CP惩罚 、调整参数选择;基于压缩估计的组变量选择 ——自然分组结构、人为分组结构;基于压缩估计的双层变量选择——复合函数型双层选择、稀疏组惩罚型双层选择、R语言实现——子集选择法、模型选择、组模型选择、双层模型选择


9.决策树与组合学习


决策树——基本概念、分类树、回归树、树的优缺点;Bagging——基本算法、袋外误差估计、变量重要性的度量;随机森林;提升法—— Adaboost算法、GBDT算法、XGBoost算法;R语言实现——数据介绍、描述性统计、分类树、Bagging 、随机森林、Boosting


10.支持向量机


最大间隔分类器——使用分割超平面分类、构建最大间隔分类器、线性不可分的情况;支持向量分类器、使用软间隔分类、构建支持向量分类器;支持向量机 ——使用非线性决策边界分类、构建支持向量机;与Logistic回归的关系;支持向量回归;R语言实现——支持向量分类器 、支持向量机、Auto数据集


11.神经网络


神经网络的基本概念——神经网络的基本单元、神经网络的结构、神经网络的学习;神经网络模型——单神经元感知器、单层感知器、BP神经网络、Rprop神经网络;R语言实现——nnet程序包、neuralnet程序包、应用案例1:利用nnet程序包分析纸币鉴别数据、应用案例2:利用neuralnet程序包分析白葡萄酒的品质


12.无监督学习


聚类分析——什么是聚类分析、对聚类分析的要求、基本聚类方法概述;划分方法——k-均值:一种基于形心的技术、k-中心点:一种基于代表对象的技术;层次方法——凝聚的与分裂的层次聚类、算法方法的距离度量、BIRCH:使用聚类特征树的多阶段聚类、Chameleon:使用动态建模的多阶段层次聚类、概率层次聚类;基于密度的方法——DBSCAN:一种基于高密度连通区域的基于密度的聚类、OPTICS:通过点排序识别聚类结构、DENCLUE:基于密度分布函数的聚类;基于网格的方法——STING:统计信息网格、CLIQUE:一种类似于Apriori的子空间聚类方法;聚类评估——估计聚类趋势、确定簇数、测定聚类质量;基于概率模型的聚类——模糊簇、基于概率模型的聚类、期望最大化算法;聚类高维数据——聚类高维数据:问题、挑战和主要方法、子空间聚类方法、双聚类、维归约方法和谱聚类;聚类图和网络数据——应用与挑战、相似性度量、图聚类方法;具有约束的聚类——约束的分类、具有约束的聚类方法 聚类分析——相异度、K-means聚类、系统聚类法;主成分分析——主成分分析的几何意义、主成分的数学推导、主成分回归、主成分分析的其他方面;因子分析、因子分析的数学模型、因子载荷阵的统计意义、因子分析的其他方面;典型相关分析——典型相关分析原理、典型相关系数的显著性检验、典型相关分析的步骤;R语言实现——聚类分析:移动通信用户细分、主成分分析:农村居民消费水平评价、因子分析:市场调查、典型相关分析:职业满意度与职业特性的关系;推荐算法——关联规则 、基本概念、基本分类、基本方法;协同过滤算法——基于邻居的协同过滤算法、基于模型的协同过滤算法;R语言实现 ——关联规则、协同过滤算法


14.文本挖掘


文本挖掘基本流程——文本数据获取、文本特征表示、文本的特征选择、信息挖掘与主题模型;R语言实现、JSS_papers数据集、拓展案例:房地产网络舆情分析


15.社交网络分析


网络的基本概念;网络特征的描述性分析——节点度 、节点中心性、网络的凝聚性特征、分割;网络图的统计模型 ——经典随机图模型、广义随机图模型、指数随机图模型、网络块模型;关联网络推断 ——相关网络、偏相关网络、高斯图模型网络、Graphic Lasso模型;二值型网络模型;R语言实现、网络的基本操作、“豆瓣关注网络”和“豆瓣朋友网络”特征分析、关联网络推断


16.并行计算


提高R语言的计算速度、R语言的并行计算、HPC多线程并行计算


12.离群点检测


离群点和离群点分析——什么是离群点、离群点的类型、离群点检测的挑战;离群点检测方法——监督、半监督和无监督方法、统计方法、基于邻近性的方法和基于聚类的方法;统计学方法——参数方法、非参数方法;基于邻近性的方法——基于距离的离群点检测和嵌套循环方法——基于网格的方法、基于密度的离群点检测;基于聚类的方法;基于分类的方法;挖掘情境离群点和集体离群点——把情境离群点检测转换成传统的离群点检测、关于情境对正常行为建模、挖掘集体离群点;高维数据中的离群点检测——扩充的传统离群点检测、发现子空间中的离群点、高维离群点建模


13.数据挖掘的发展趋势和研究前沿


挖掘复杂的数据类型——挖掘序列数据:时间序列、符号序列和生物学序列、挖掘图和网络、挖掘其他类型的数据;数据挖掘的其他方法——统计学数据挖掘、关于数据挖掘基础的观点、可视和听觉数据挖掘;数据挖掘应用——金融数据分析的数据挖掘、零售和电信业的数据挖掘、科学与工程数据挖掘、入侵检测和预防数据挖掘、数据挖掘与推荐系统;数据挖掘与社会——普适的和无形的数据挖掘、数据挖掘的隐私、安全和社会影响;数据挖掘的发展趋势


******************************************************************************


七、数据可视化

1.数据可视化简介


可视化释义;可视化简史;数据可视化详解——数据科学的发展、数据可视化的意义、数据可视化分类、数据可视化与其他学科领域的关系;数据可视化研究挑战


2.视觉感知与认知


视觉感知和认知;视觉感知和认知的定义、视觉感知处理过程、格式塔理论、相关实验;颜色——颜色刺激理论、色彩空间;视觉编码原则——相对判断和视觉假象、标记和视觉通道 、视觉通道的概念、视觉通道的特性


3.数据


数据基础——数据分类、数据集 、数据相似度与密度;数据获取、清洗和预处理——数据获取 、数据清洗、数据精简、其他常用的数据预处理步骤;数据组织与管理——数据整合与集成、数据库与数据仓库;数据分析与挖掘、探索式数据分析、联机分析处理、数据挖掘 ;数据科学与可视化、数据工作流、可视数据挖掘;数据科学的挑战


4.数据可视化基础


数据可视化基本框架——数据可视化流程、数据可视化设计;可视化中的数据——数据认知 、数据类型;可视化的基本图表——原始数据绘图、简单统计值标绘、多视图协调关联;可视化设计原则——数据到可视化的直观映射、视图选择与交互设计、信息密度――数据的筛选 、美学因素、动画与过渡、可视化隐喻、颜色与透明度;可视化理论发展——图形符号学、关系数据的图形表示、图形语法、基于数据类型的研究、基于数据状态模型的研究、多维关系数据库可视化分析系统


时空数据篇


5.空间标量场可视化


一维标量场可视化;二维标量场可视化——颜色映射、等值线、高度图 ;三维标量场数据可视化——空间数据表达、空间数据特征计算、间接体绘制、规则三维标量场的直接体可视化、不规则体数据的体可视化


6.大规模多变量空间数据场可视化


大规模空间标量场数据的实时可视化——大规模空间标量场数据的单机绘制、大规模空间标量场数据的并行绘制 、时变空间标量场数据加速绘制方法;时变异构空间数据场的特征追踪与可视化——时变空间标量场数据的特征提取、异构数据的特征融合、时变空间标量场数据的特征追踪;空间向量场数据可视化、图标法、几何法、纹理法、拓扑法;空间张量场数据可视化——张量场的数学描述 、基于几何的方法、基于纹理的方法、基于拓扑的方法、高阶张量场可视化;多变量空间数据场可视化——多变量空间数据场的特征表达与关联分析 、多变量空间数据场的可视化与交互


7.时变数据可视化


时间属性的可视化——线性和周期时间可视化、日历时间可视化、分支和多角度时间可视化 、时间属性的动态可视化;多变量时变型数据可视化——基于线表示的可视化、基于图结构的可视化、时间序列数据的可视化交互;流数据可视化——流数据可视化模型、流数据处理技术、流数据可视化案例、并行流计算框架


非时空数据篇


8.层次和网络数据可视化


层次数据——层次数据的可视化、节点- 链接法、空间填充法、其他方法;网络数据——网络和图、网络数据可视化、网络数据的地图隐喻可视化、超图及其可视化、动态网络数据可视化、图可视化的视觉效果 、图可视化中的交互、网络数据可视化的挑战


9.文本和文档可视化


文本可视化释义——文本信息的层级、文本可视化的研究内容与任务、文本可视化流程;文本信息分析基础——分词技术和词干提取、数据模型;文本内容可视化——基于关键词的文本内容可视化、时序性的文本内容可视化、文本特征的分布模式可视化、文档信息检索可视化 、软件可视化;文本关系可视化——文档相似性可视化、文本内容关联可视化、文档集合关系可视化;文件情感分析可视化——顾客评价可视化、情感变化可视化、情感差异可视化


10.跨媒体数据可视化


图像——图像网格、基于时空采样的图像集可视化、基于相似性的图像集可视化、基于海塞图的社交图像可视化、基于故事线的社交图像可视化;视频——视频摘要、视频抽象;声音与音乐——声乐波形可视化、声乐结构的可视化;超媒体——社交媒体可视化、社交网络可视化;数字生活可视化


11.复杂高维多元数据的可视化


高维多元数据——空间映射法、图标法、基于像素图的方法、基于动画的方法;非结构化与异构数据的可视化——非结构化数据、异构数据;大尺度数据的可视化——基于并行的大尺度数据高分辨率可视化、大尺度数据的分而治之可视化与分析;数据不确定性的可视化——不确定性的基本定义、不确定性的来源、不确定性的可视化方法


用 户 篇


12.可视化中的交互


交互准则——交互延时、交互成本 、交互场景变化;交互分类——按低阶交互操作分类、按交互操作符与空间分类、按交互任务分类;交互技术——选择、导航、重配、编码、抽象/ 具象、过滤、关联、概览 细节、焦点 上下文;交互与硬件设备——交互环境、交互设备


13.可视化效果评测与用户实验


评测流程;评测方法——用户实验、专家评估、案例研究、指标评估、众包、标注;用户实验——确定实验目标、准备实验、进行实验、分析结果并讨论、评测案例分析


14.面向领域的数据可视化


高性能科学计算——高性能科学可视化的挑战、重要信息的提取和显示、原位可视化、未来挑战;生命科学——临床医学影像、其他影像、电生理信号、OMICS 组学、深度学习;其他科学与艺术——气候学与气象中的可视化、面向艺术的表意性可视化;网络与系统安全的可视化——基于可视变换的虫洞攻击可视化、可信计算的可视化、安全日志数据的可视化 、智能电网数据的可视化;商业智能可视化——商业智能、商业智能中的数据可视化、云端商业智能、未来趋势;金融数据可视化——金融数据来源、金融数据分析的自动化方法、金融数据可视化方法、金融数据可视分析


15.可视化研究与开发资源


可视化软件——医学可视化软件、科学可视化软件、信息可视化软件、可视分析软件;可视化开发工具——应用程序开发工具、Web 应用开发工具;数据分析和数据挖掘软件与开发工具;可视化数据集资源 ;可视化信息资源;海外可视化研究机构


*************************************************************************


参考资料:


1. 《计算机视觉:算法与应用 [Computer Vision:Algorithms and Applications]》,Richard,Szeliski,艾海舟 著,艾海舟,兴军亮 等译


2. 《视觉计算基础:计算机视觉、图形学和图像处理的核心概念》 [美] 阿娣提玛珠德(Aditi Majumder) 著


3. 《计算机视觉:模型、学习和推理 [Computer Vision Models,Learning,and Inference]》 [英] 西蒙,J.D.,普林斯 著,苗启广,刘凯,孔韦韦 等 译


4. 计算机视觉――一种现代方法(第二版)[美] David,A.,Forsyth(D.,A.,福赛斯) ... 著,高永强 等译


5. 《计算机视觉》,刘绍辉,姜峰 著


6. 《OpenCV 4计算机视觉项目实战(原书第2版)》,[西班牙] 大卫米兰埃斯克里瓦(David,Milln,Escriv) 著,冀臻 译


7. 《图像处理、分析与机器视觉第4版》Milan Sonka,Vaclav Hlavac,Roger Boyle 著


8. 《图像处理、分析与机器视觉》,杨高科编著


9. 《计算机图形学(第4版)》 [Computer Graphics with OpenGL, Fourth Edition]Donald Hearn(D赫恩) 等,M.Pauline Baker(M.P.巴克),Warren,R.Carithers(W.R.卡里瑟斯) 著,蔡士杰,杨若瑜 译


10. 《图像工程(第4版)》,章毓晋 著


11. 《计算机视觉八大任务全概述:PaddlePaddle工程师详解热门视觉模型》量子位


12. 《知识图谱:方法、实践与应用》, 王昊奋,漆桂林,陈华钧 编


13. 《数据可视化(第2版)》陈为 等 著


14. 《数据挖掘 概念与技术(第3版)》,[美] Jiawei Han,[美] Micheling Kamber,[美] Jian Pei 等 著,范明,孟小峰 译


15. 《数据科学》方匡南 著


************************************************************************


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至123456@qq.com 举报,一经查实,本站将立刻删除。

联系我们

工作日:9:30-18:30,节假日休息