2022主要研究内容
郝伟 2022/03/03

1 大数据处理

利用大数据技术进行海量数据分析，包括以下几方面内容：

1.1 集群环境建设

理解掌握Hadoop及其生态内框架，能够组建基于多机器的计算机集群及十多种大数据组件的部署和配置方法。

1.2 大数据开发技术

基于常用的大数据组件进行基于Java/C/C++的二次开发，对海量数据进行读取、计算和写回等操作。

1.3 大数据挖掘技术

利用统计学、数据分析、机器学习等技术对数据进行深度分析，提取重要信息。

1.4 云计算方向

在大数据平台上对海量数据进行复杂耗时的计算，并能够分析和理解数据计算的正确性。

2 知识图谱方向

2.1 图谱表示 (Knowledge Representation)

如何定义和建立对知识的表示，是知识图谱最基本的内容。

2.2 图谱嵌入 (Graph Embedding)

Embedding在数学上是一个函数，将一个空间的点映射到另一个空间，通常是从高维抽象的空间映射到低维的具象空间。
Embeding的意义将高维数据转换到低维利于算法的处理, 例如使用one-hot向量长度随样本的变化而变化，以及无法表示两个实体之间的相关性这一问题。

2.3 知识融合 (Graph Fusion)

知识融合，即合并两个知识图谱(本体)，基本的问题都是研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来，包括：

2.4 本体匹配（ontology matching）

侧重发现模式层等价或相似的类、属性或关系，也成为本体映射（mapping）、本体对齐（alignment）。

实体对齐（entity alignment）
侧重发现指称真实世界相同对象的不同实例，也称为实体消解（resolution）、实例匹配（instance matching）。
实例匹配（instance matching）
一般通过冲突检测、真值发现等技术消解知识图谱融合过程中的冲突，再对知识进行关联与合并，最终形成一个一致的结果。
图谱的应用
使用与具体应用相结合。

3、人工智能方向

致力于人工智能技术在网络安全中的应用研究，尤其是在大数据安全分析，数据挖掘，漏洞探扫，入侵检测，恶意样本识别等方面。同时，通过结合大数据技术、自然语言处理和知识图谱技术，实现人工智能技术在以漏洞为核心的网络安全中的综合攻防能力。具体包括以下方面

3.1 网络态势智能感知技术

态势感知这一概念最初是由Endsley提出了，在1999年这一概念开始被应用在信心网络中，从而实现大规模的网络态势预测。态势感知是一种基于环境的、动态、整体地洞悉安全风险的能力，是以安全大数据为基础，从全局视角提升对安全威胁的发现识别、理解分析、响应处置能力的一种方式，最终是为了决策与行动，是安全能力的落地。随着当前互联网技术的进一步发展，信息网络安全问题逐渐成为社会关注的焦点，而基于人工智能的态势感知技术得到进一步完善与发展，为信息网络安全性的进一步提高创造了有利条件。目前，这一技术也将被应用在网络信息安全管理中，用于识别现阶段网络节点的系统中可能存在的风险以及遇到的问题并及时予以有效解决，对于保证系统安全运行具有重要意义。

3.2 自动化渗透测试研究 (Autumated Penetration Testing, APT)

渗透测试是为了证明网络防御按照预期计划正常运行而提供的一种安全检测机制。在渗透测试中，安全专业人士在系统和应用中执行蓄意攻击，以确定是否可能获得未经授权的访问权限。但是人工测试的效率不高，所以利用计算机强大的性能，使用自动化的方式实现渗透测试。APT能够有效地提高检测速度，可以广泛测试大量系统中很多已知安全漏洞，减轻了高技能人员繁琐的工作，让他们可以集中精力来协调测试以及运用其专业知识在最重要的地方。但是自动化测试在复杂的网络环境中，正确高效的运行也存在一定的困难。

3.3 面向数据安全治理的内容智能发现与分类

参考：https://zhuanlan.zhihu.com/p/350937332
识别样本中的敏感数据，构建基于敏感数据本体的分级分类模型，判断数据所属的类别以及级别。

利用远程监督技术，基于小样本构建文档分类分级样本库。
结合当下先进的深度学习和机器学习技术，利用已构建的样本库，提取文本语义特征，构建泛化能力强且能自我学习的文档分类分级模型。

3.4 网络架构智能搜索技术

3.5 恶意样本检测技术

3.6 人工智能应用研究

主要研究如何将人工智能相关技术应用到网络安全中，尤其是通过对一些已有框架和技术的调研验证，实现从无到有或者有从到优的技术演进。

4 安全应用研究

致力于小型路由器、摄像头、摄影机、智能汽车、工控系统、传感器节点、卫星通信节点等的研究和漏洞挖掘。
结合工业应用行业用户安全需求，研究多类型专用工业控制系统与节点设备安全机制，发现系统设计与实现过程中的安全缺陷，
为工业控制系统与设备的安全检测、安全修复提供技术支撑。
具体的研究内容包含一下几方面：

4.1 固件提取与分析

4.2 协议安全

4.3 加密数据分析

4.4 传输通信安全

4.5 存储安全

4.5 控制系统安全

4.7 云端安全

5 自然语言处理（NLP）

5.1 安全信息分词

使用Jieba或HanLP对安全领域的词汇进行高精度分词处理。分词的过程不难，基本一两天就可以上手，但是需要花一定的时间通过添加自定义词库的形式优化分词的精确程度。

5.2 关键词提取

5.3 词频统计

5.4 语法分析

5.5 情感分析

6 自动化处理技术

6.1 网络爬虫

6.2 自动化任务

其他

入侵检测：包括针对数据采集、数据抽样、行为分类和检测报告。