知识图谱(三)之知识查询语言-开发者社区

一:查询语言介绍

1.为什么不使用sql

关系型数据库查询语言——SQL

方式：数据以表的形式存在, 有比较强的schema定义, 表和表之间的数据关联以join的方式实现.

缺点：MySQL主要是存储和查询二维表数据，对三元组数据没有单独意义；

多跳关联查询需要多表连接，效率低

2.图数据查询语言的区别

二:命名实体识别(NER)

2.1基础知识

2.1.1什么是NER

实体：文本之中承载信息的语义单元。
常见的实体包括七种类别：人名、地名、机构名、时间、日期、货币、百分比。
实体抽取：又称为命名实体识别,指的是从文本之中抽取出命名性实体，并把这些实体划分到指定的类别。

2.1.2识别后格式

原文本:

命名实体后的文本:

总体是字典格式,里面的命名实体是双层列表嵌套格式,下标是左闭右开.

补充:文本分类后的格式

2.2命名实体识别的方法

2.2.1基于规则的方法实现NER

使用自定义规则匹配NER:

eg:使用正则表达式匹配NER

优点:方便,快捷

缺点:泛用性差,后期格式越来越复杂,难以维护

2.2.2基于机器学习方法实现NER

机器学习把NER转换为序列标注任务

1.实现步骤:

人工选择特征
训练模型
预测实体

2.模型选择

机器学习的方法是把实体抽取任务转换为序列任务,每个token做标注(理论上所有分类模型都可以作为标注模型,但是效果最好的是条件随机场(CRF)):

B:开头

E:结尾

3.缺点:

缺点:依赖特征的选择,特征选择的不好,很难有好的效果.

2.2.3基于深度学习的方法实现NER

深度学习也是把NER转换为序列标注任务

1.概念:

基于深度学习的方法主要使用神经网络模型，结合条件随机场模型。常用的神经网络模型包括卷积神经网络（CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM）等，其中BiLSTM-CRF是目前最为常用的命名实体识别模型

2.原理:

3.优缺点

优点:特征靠模型自己提取

缺点:需要大量的标注文本

2.3NER评测标准

精确率：模型识别出来的实体中，被所有预测为正的样本中实际为正样本的概率

召回率：模型识别出来的实体中，实际为正的样本中被预测为正样本的概率

F1值: 准确率和召回率的调和平均值，可以对系统的性能进行综合性的评价

Typora下载与激活

下载下载这一步很关键，一定要下对版本，本教程只支持 1.10.x以前的版本安装包和补丁下载 1、历史版本安装包 2、补丁提取码：7ih6 安装根据需求下载如下版本： 根据顺序依次按照可自定义安装路径如D:\Typora一直下一步&…

李华

学长亲荐2026自考AI论文平台TOP10：选对工具轻松过关

学长亲荐2026自考AI论文平台TOP10：选对工具轻松过关 2026年自考AI论文平台测评：选对工具事半功倍随着人工智能技术的不断进步，越来越多的自考生开始借助AI写作工具提升论文撰写效率。然而，面对市场上琳琅满目的平台，如…

李华

AD原理图转成Cadence格式

AD原理图转成Cadence格式AD中的操作1.建工程2.保存工程和原理3.编译工程Capeture中操作1.导入文件选项2.文件路径选择3.注意参考版本： AD:17.1.9 Cadence：16.6 AD中的操作 1.建工程 AD中的原理图一定要属于一个工程，只有原理图是不行的&am…

李华

从无效沟通到首通成交：B2B拓客的秘密武器曝光

在B2B销售的过程里，真正花费最多时间的事情并非讨论方案内容，而是要寻找到那个正确的对接人，这是相当耗费精力的。不知道你是否也曾有过如同以下这样的经历?当你拨打1688平台上标注为“厂家”的电话时，电话是由客服接通的&#x…

李华

百万年薪密码：AI测试架构师能力矩阵全解析

AI测试时代的架构师价值‌ 随着机器学习模型、智能推荐系统、自动驾驶、AIoT等复杂智能应用成为软件生态的主流，软件测试的边界、复杂度和技术栈发生了质的飞跃。传统的手工测试和基于脚本的自动化测试在面对海量数据、非线性逻辑、持续演化的模型和模糊的“正确性…

李华

【收藏】大模型薪资太香了！小白/程序员零基础入门指南+全套资料免费领

作为深耕技术圈十余年、常年盯紧职场风向的老程序员，我有个职业敏感度培养习惯——每隔一段时间就会去Boss直聘等招聘平台，深挖大模型相关岗位的招聘动态。每次点开薪资详情页，都忍不住感叹：这薪资梯队，真有种想穿越回…

李华