陈海华:AI+人的技术实现 欢迎参与讨论
来自: 陈海华 2019-08-05 18:04:21 完整文档 https://pan.wps.cn/l/sNBmm1Sli [文档] AI+人技术实现.docx
一、理论支撑及意义
陈海华 cenachen
知乎 https://www.zhihu.com/people/cenachen/activities
张靖 Timingtime
神经科学观点
1.embodiment具身化,连续性智能体-----创造智能机器也许还需要身体
Antonio Damasio神经科学家
为什么要研究意识及理解意识
http://c.open.163.com/mob/video.htm?plid=ME74OT7I6&mid=ME74PBN10#share-mob
SwiftKey联合创始人谈智能的基础:创造智能机器也许还需要身体
https://baijiahao.baidu.com/s?id=1562381304850853&wfr=spider&for=pc&sa=vs_ob_realtime&isFailFlag=1
2.自我 自传式记忆
《笛卡尔的错误》 10章关注身体脑181页神经系统中的自我 http://b.7dtime.com/B079L6XD8S/14/2.html
《Self comes to mind》
《感受发生的一切》摘录 (连续不断重新激活的神经网络,它是以一些聚合区为基础的,这些聚合区存在于颞叶和额叶的高级皮层、某些皮层下神经核团(包括部分杏仁核)。这些区域的同时激活与丘脑核团是同步的,也就是说,会对身体状态进行扰动(情绪反应),引起原始自我的改变,再经过原始自我与自传式表象的二级映射,形成核心意识https://www.cnblogs.com/lsgxeva/p/10047365.html)
《第二次成人研究初报》 胡爱生,刘巧燕
3.自我记忆内容
《笛卡尔的错误》 10章关注身体脑181页神经系统中的自我 http://b.7dtime.com/B079L6XD8S/14/2.html
正如我所看到的那样,自我的神经基础至少存在于两种表征的连续激活中。其中一组表征涉及个人自传体记忆中的关键事件,在此基础上,可以通过部分激活拓扑性质的感觉映射不断重建身份。描述我们一生的倾向性表征与大量分类事实有关,这些事实定义我们是谁:我们做了什么、我们喜欢什么、我们喜欢谁、我们使用什么类型的物体、我们经常去哪些地方、我们经常做什么。你可以将这组表征看成J.埃德加·胡佛(J. Edgar Hoover)所擅长收集的文件,除了一点,这些文件存在于大脑的关联皮层中,而不是在文件柜中。此外,除了这种分类之外,还有来自我们过去历史的独特事实,这些事实不断被激活为映射表征:我们生活和工作在哪儿、我们的工作是什么、我们自己的名字、近亲和朋友的名字、城市和国家的名字,等等。最后,在最近的倾向性记忆中,个体还收集了最近发生的事件,以及这些事件的大致时间,我们在记忆中还收集了一些计划,还有想象中我们打算做的事情或期望发生的事情。这些计划和虚构事件构成了我所说的“可能未来的记忆”,它就像其他任何记忆一样被置于倾向性表征中。
4.类hash结构 聚合区
《笛卡尔的错误》 10章关注身体脑181页神经系统中的自我 http://b.7dtime.com/B079L6XD8S/14/2.html
现在考虑以下几种可能性。首先考虑一下,大脑拥有第三组神经结构,这个结构既不是支持客体表象的结构,也不是支持自我表象的神经结构,而是与两者都相互关联。换句话说,这第三组神经元集合结构就是所谓的聚合区,是在脑皮层区域和皮层下核团中构建倾向性表征的神经基础。
接下来,假设当有机体被客体表象所扰动时,第三组神经元集合从客体表征和自我表征两者中接收信号。换句话说,当有机体对客体进行反应时,这第三组集合也在反应的过程中构建自我的倾向性表征。这种倾向性表征没有什么神秘之处,就是大脑擅长的有关储存、制作和重塑的那种表征,这并不奇怪。此外,我们知道大脑拥有所有必需的信息来构建这样一种倾向性表征:在我们看到一个客体并在早期的视觉皮层中形成表征后不久,各个躯体感觉皮层也形成了有机体对客体反应的其他许多表征。
我所设想的倾向性表征既不是那个小矮人创造的,也不是被它所觉知的,其他倾向性表征也是如此。在与之相关的早期感觉皮层中,倾向性表征有可能重新激活一种表象,即有机体针对特定客体的反应所生成的躯体感觉表象。
最后,考虑到上面我所描述的所有部分,即一个被表征的客体,对被表征客体作出反应的有机体,以及由于有机体对客体的反应而处于改变过程的自我的状态。这些同时被保持在工作记忆中,并在早期的感觉皮层中同时或交替出现。我认为,大脑不仅产生客体表象和有机体对客体反应的表象,还产生了第三种表象,即有机体对客体感知和反应时产生的表象。我相信主观性就来自第三种表象。
因此,要产生主观性,至少需要早期感觉皮层,包括躯体感觉,以及感觉和运动联合皮层。另外还有构成第三组集合的皮层下核团,特别是丘脑和基底神经节。
这种基础神经系统不需要语言。我所设想的元自我建构纯粹是非语言过程,是主要参与部分从另外两者的外部视角出发得出的概括性看法。实际上,这种第三方观点构成了一个非语言叙述文件,该文件记录着各参与部分每时每刻所发生的事。这种叙述可以在没有语言的情况下实现,而以感觉系统和运动系统在空间和时间上的基本表征为工具。我认为没有语言能力的动物也可以实现这个过程。
人类具有语言带来的二级叙事能力,可以从非语言叙述中产生语言叙述。我们精巧的主观性来自后者。语言可能不是自我的根源,但它肯定是“我”这个词的根源。
对另一个有关主观性的神经基础的解释我不是很熟悉,但是由于主观性是意识的一个关键特征,所以我需要简要提一下我的观点和其他人的观点有什么联系。
脑科学研究论证
1大脑的.时间戳
http://mip.mtrend.cn/news/35263.html
二、项目 、里程规划
0.1web知识图谱web架构搭建
手动交互,存储,推荐功能,python
包:Anaconda
数据库Mysql mangodb
IDE: pycharm
Web架构:Django
参考设计
http://www.doc88.com/p-5741707383184.html
基于知识图谱的个人知识管理平台的设计与实现-
附加功能
a.(jQuery鼠标互动的网站小人)
b.数据私有化ipfs python API
学习starfire 做ipfs(https://github.com/b3log/starfire)
关注(使用 Solid 私有化存储 IPFS 文件哈希https://www.v2ex.com/amp/t/516150
https://github.com/Eximua/solid-ipfs)
2.0问答chatbot交互
3.0app视觉语音交互
4.0主动交互
三、推理网络
简单化实现 REFO: Regular Expressions for Objects
在冷启动一段时间,获得了一定用户使用数据之后,我们可以考虑引入其他的方法来改善系统的性能,然后逐渐减少正则规则在整个系统中的比重
库:jena,useki,中文RDF:OPENKG
D2RQ SPARQL endpoint
四、数据存储----图数据库
(1) 数据存储内容 及格式
(数据存储支持、数据操作和管理方式、支持的图结构、实体和关系表示、查询机制)
1.原则:基础存储
1.可按数据场景选择使用关系数据库、NoSQL数据库及内存数据库。
2.基础存储保证可扩展、高可用
2.数据分割
1.基本类型:整数表、浮点数表、日期类型表、…
2.集合类型:List型表、Range型表、Map型表、…
1.属性表:依据数据类型划分
2.大属性单独列表:例如数量超过10M的属性单独列表
3.缓存与索引
1.SPO、SOP、PSO、POS、OSP、OPS
2.SPO、POS、OSP
1.使用分布式 Redis 作为缓存,按需对数据进行缓存。
2.对三元组表按需进行索引,最多情况下可建立九重索
4.善于使用现有成熟存储
1.使用ElasticSearch实现数据的全文检索
2.结构固定型的数据可使用关系数据库或NoSQL
5.对于非关系型的数据尽量不入图存储,避免形成大节点
1.非关系型的数据,使用适合的数据存储机器进行存储,通过实体链接的方式实现与图谱数据的关联。
6.不直接在图存储中进行统计分析计算
1.对于需要进行统计分析计算的数据,需要导出到合适的存储中进行。
(2)数据类型
知识图谱时态信息及存储(时态数据库TDSQL)
1.事实的生成时间
2.某事实的有效时间段
3.某一对象在特定历史时刻的状态
4.知识图谱在过去特定时间的版本
关系型数据(通过关系形成网络)
关系型数据的存储方法:作为实体存入知识图谱,通过它们之间的关系形成图谱网络
结构型数据(与主体进行关联,但不会再续延伸)
结构型数据的存储方法:作为记录型数据存入合适的存储中,通过链接与图谱中的实体进行关联。
属性型数据
属性型数据的存储方法:作为实体的数值属性存入知识图谱
时态型数据
时态型数据的存储方法:使用基于知识图谱上的时间存储中间件进行存储和查询处理
Schema定义:概念选取, Schema定义:关系和属性的定义,
(3)图数据库进行数据存储一般过程
使用图数据库进行数据存储一般过程:
1.导入实体,概念(Label)
2.导入实体属性
3.导入实体间关系
最佳实践过程:
1.分批导入,并使用Index提升导入时查询效率
2.按数据的类型、属性不同准备导入文件
3.数据主键维护,使用Constraints
4.尽可能保证导入数据格式正确