立即参团

  原价¥899.00

  50人以上 ¥499.00

  100人以上 ¥399.00

  

  《知识图谱》第一期

  课程简介:

本次的知识图谱课程主要包括三大部分:

1)知识图谱的工程方法论。指导学员了解并掌握知识图谱的基本概念和发展历史,梳理清知识图谱的技术体系,掌握知识图谱的核心技术原理,建立知识图谱工程的方法论思维。

2)知识图谱的实战技术。从实战出发,围绕知识表示、知识抽取、语义搜索、知识问答、知识推理、知识融合等系统性介绍知识图谱相关的实战技术,使得学员具备研发知识图谱相关应用的基础能力。

3)知识图谱的典型应用。结合医疗、金融、电商等实际应用场景,介绍知识图谱各个技术点的实际应用落地方式,使得学员具备结合自身背景开展知识图谱技术实践的应用能力。

  主讲老师:

王昊奋著名知识图谱专家

博士毕业于上海交通大学,CCF术语专委会执委,中文信息学会语言与知识计算委员会副秘书长,共发表75余篇高水平论文。中文知识图谱zhishi.me创始人,OpenKG联盟发起人之一,其带队构建的语义搜索系统在Billion Triple Challenge中荣获全球第2名;在著名的本体匹配竞赛OAEI的实体匹配任务中斩获得全球第1名。曾主持并参与多项国家自然科学基金、863重大专项和国家科技支撑项目,以学术负责人身份参与Paypal、Google、Intel、IBM、百度等企业的合作项目。

  开课时间:2017年10月24日

学习方式:

在线直播,共11次

每周2次(周二、四晚上20:00-22:00)

直播后提供录制回放视频,在线反复观看,有效期1年

  课程大纲

第一课: 知识图谱概论

1. 知识图谱的起源和历史

  2. 典型知识库项目简介

  3. 知识图谱应用简介

  4. 本次课程覆盖的主要范围:知识表示与建模、知识抽取与挖掘、知识存储、知识融合、知识推理、语义搜索、知识问答和行业知识图谱应用剖析等内容。

  第二课: 知识表示与知识建模

  1. 早期知识表示简介

  2. 基于语义网的知识表示框架

  a. RDF和RDFS

  b. OWL和OWL2 Fragments

  c. SPARQL查询语言

  d. Json-LD、RDFa、HTML5 MicroData等新型知识表示

  3. 典型知识库项目的知识表示

  4. 基于本体工具(Protege)的知识建模最佳实践

  第三课: 知识抽取与挖掘I

  1. 知识抽取任务定义和相关比赛:实体识别、关系抽取和事件抽取

  2. 面向结构化数据(关系数据库)的知识抽取,包括D2RQ和R2RML等转换与映射规范与技术介绍

  3. 面向半结构化数据(Web tables, 百科站点等)的知识抽取

  a. 基于正则表达式的方法

  b. Bootstrapping和Wrapper Induction介绍

  4. 实践展示:基于百科数据的知识抽取

  第四课: 知识抽取与挖掘II

  1. 面向非结构化数据(文本)的知识抽取

  a. 基于本体的知识抽取,包括NELL和DeepDive系统介绍

  b. 开放知识抽取,包括TextRunner、Reverb和OLLIE等系统介绍

  2. 知识挖掘

  a. 知识内容挖掘:实体消歧与链接

  b. 知识结构挖掘:关联规则挖掘与社区发现

  c. 知识表示学习与链接预测,包括TransE和PRA等算法介绍

  第五课: 知识存储

  1. 基于关系数据库的存储设计,包括各种表设计和索引建立策略

  2. 基于RDF的图数据库介绍

  a. 开源数据库介绍:Apache Jena、Sesame、gStore、RDF-3X等

  b. 商业数据库介绍:Virtuoso、AllegroGraph、BlazeGraph等

  3. 原生图数据库介绍,包括Neo4j、OrientDB、Titan和Cayley等

  4. 实践展示:使用Apache Jena存储百科知识,并使用Fuseki构建图谱查询服务

  第六课: 知识融合

  1. 知识融合任务定义和相关竞赛:本体对齐和实体匹配

  2. 本体对齐基本流程和常用方法

  a. 基于Linguistic的匹配

  b. 基于图结构的匹配

  c. 基于外部知识库的匹配

  3. 实体匹配基本流程和常用方法

  a. 基于分块的多阶段匹配

  b. 基于规则(配置或通过学习)的实体匹配

  4. 知识融合工具介绍:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault

  5. 实践展示:使用Falcon-AO融合百度百科与维基百科中的知识

  第七课: 知识推理

  1. 本体知识推理简介与任务分类,包括概念可满足性、概念包含、实例分类和一致性检测等

  2. 本体推理方法与工具介绍

  a. 基于Tableaux运算的方法:Fact++、Racer、Pellet和Hermit等

  b. 基于一阶查询重写的方法:Ontology-based Data Access的Ontop等

  c. 基于产生式规则的方法(如Rete):Jena、Sesame和OWLIM等

  d. 基于逻辑编程(如Datalog)改写的方法:KAON2和RDFox等

  3. 实践展示:使用Jena完成百科知识上的上下位推理、缺失类别补全和一致性检测等

  第八课: 语义搜索

  1. 语义搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等

  2. 基于语义标注的网页搜索

  a. Web Data Commons项目介绍

  b. 排序算法介绍,扩展BM25

  3. 基于图谱的知识搜索

  a. 本体搜索(ontology lookup)

  b. 探索式知识检索,包括查询构造、结果排序和分面(facets)推荐

  4. 知识可视化,包括本体、查询、结果等的展现方式和可视化分析

  5. 实践展示:使用ElasticSearch实现百科数据的语义搜索

  第九课: 知识问答I

  1. 知识问答概述和相关数据集(QALD和WebQuestions)

  2. 知识问答基本流程

  3. 知识问答主流方法介绍

  a. 基于模板的方法,包括模板定义、模板生成和模板匹配等步骤

  b. 基于语义解析的方法,包括资源映射,逻辑表达式候选生成与排序等

  c. 基于深度学习的方法

  第十课: 知识问答II

  1. IBM Watson问答系统及核心组件详细解读

  a. 问句理解

  b. 候选答案生成

  c. 基于证据的答案排序

  2. 实践展示:面向百科知识的问答baseline实现

  第十一课: 行业知识图谱应用

  1. 行业知识图谱特点

  2. 行业知识图谱应用,包括金融、医疗、数字图书馆等领域应用

  3. 行业知识图谱构建与应用的挑战

  4. 行业知识图谱生命周期定义和关键组件

常见问题:

Q:参加本门课程有什么要求?

A: 有一定Python编程能力,有基本大学数学基础。

Q: 有课外学习资料吗?

A: 有,老师会根据情况提供讲义,并给出进阶学习资源与项目的建议。

  参团!咨询!查看课程!

  就点这里!