更改

思维软件操作系统设计框架

添加3,532字节, 2019年8月5日 (一) 05:01
创建页面,内容为“{{4}}0.1web知识图谱web架构搭建 手动交互,存储,推荐功能,python 包:Anaconda 数据库Mysql mangodb IDE: pycharm Web架构:Django 附加...”
{{4}}0.1web知识图谱web架构搭建

手动交互,存储,推荐功能,python
包:Anaconda
数据库Mysql mangodb
IDE: pycharm
Web架构:Django


附加功能
a.(jQuery鼠标互动的网站小人)

b.数据私有化ipfs python API

学习starfire 做ipfs(https://github.com/b3log/starfire)

关注(使用 Solid 私有化存储 IPFS 文件哈希https://www.v2ex.com/amp/t/516150
https://github.com/Eximua/solid-ipfs)

2.0问答chatbot交互

3.0app视觉语音交互

4.0主动交互




一、推理网络
简单化实现 REFO: Regular Expressions for Objects
在冷启动一段时间,获得了一定用户使用数据之后,我们可以考虑引入其他的方法来改善系统的性能,然后逐渐减少正则规则在整个系统中的比重
库:jena,useki,中文RDF:OPENKG
D2RQ SPARQL endpoint

二、数据存储----图数据库
(1) 数据存储内容 及格式
(数据存储支持、数据操作和管理方式、支持的图结构、实体和关系表示、查询机制)
原则:基础存储
可按数据场景选择使用关系数据库、NoSQL数据库及内存数据库。
基础存储保证可扩展、高可用
数据分割
基本类型:整数表、浮点数表、日期类型表、…
集合类型:List型表、Range型表、Map型表、…
属性表:依据数据类型划分
大属性单独列表:例如数量超过10M的属性单独列表
缓存与索引
SPO、SOP、PSO、POS、OSP、OPS
SPO、POS、OSP
使用分布式 Redis 作为缓存,按需对数据进行缓存。
对三元组表按需进行索引,最多情况下可建立九重索
善于使用现有成熟存储
使用ElasticSearch实现数据的全文检索
结构固定型的数据可使用关系数据库或NoSQL
对于非关系型的数据尽量不入图存储,避免形成大节点
非关系型的数据,使用适合的数据存储机器进行存储,通过实体链接的方式实现与图谱数据的关联。
不直接在图存储中进行统计分析计算
对于需要进行统计分析计算的数据,需要导出到合适的存储中进行。

(2)数据类型
知识图谱时态信息及存储(时态数据库TDSQL)
事实的生成时间
某事实的有效时间段
某一对象在特定历史时刻的状态
知识图谱在过去特定时间的版本
关系型数据(通过关系形成网络)
关系型数据的存储方法:作为实体存入知识图谱,通过它们之间的关系形成图谱网络
结构型数据(与主体进行关联,但不会再续延伸)
结构型数据的存储方法:作为记录型数据存入合适的存储中,通过链接与图谱中的实体进行关联。
属性型数据
属性型数据的存储方法:作为实体的数值属性存入知识图谱
时态型数据
时态型数据的存储方法:使用基于知识图谱上的时间存储中间件进行存储和查询处理
Schema定义:概念选取, Schema定义:关系和属性的定义,
图数据库进行数据存储一般过程
使用图数据库进行数据存储一般过程:
导入实体,概念(Label)
导入实体属性
导入实体间关系
最佳实践过程:
分批导入,并使用Index提升导入时查询效率
按数据的类型、属性不同准备导入文件
数据主键维护,使用Constraints
尽可能保证导入数据格式正确

语料库搜集及建立常识库
�---�

这些概念当做每个记录标签,时间标签,然后在图数库存储这些标签当做实体
加上,可完成日记和日程管理
匿名用户