黄曾阳 (中科院声学所 HNC实验室) 2006年8月22日
目录 01探索之梦是最美的存在 02关于思维存在性的基本问题 03 HNC是关于思维存在性的局部探索 04语言概念空间符号体系 05语言概念空间符号体系的探索需要新思路 06语言概念空间符号体系的HNC表示式 07《全书》概貌 08概念延伸结构表示式示例 09我只承担《全书》的M论述
01探索之梦是最美的存在 智者们都说 哲学是不可定义的,形而上学也是不可定义的。 我是愚者,将试着给出下面的定义: 神学是对心灵的探索,哲学是对存在的探索,科学是对形式的探索, 我还要说 神学、哲学和科学是一切文明内在3要素,可简称文明基因。 三者的统称就是《老子》所说的道, 所以 《老子》说 三生万物。 形而上学是对道的探索,是对神学、哲学和科学共同体的探索。
关于文明基因的三点思考 第一点 文明兴衰的根本原因何在? 第二点 政治与经济、文学和艺术、技术与工程是文明基因么? 第三点 古老的中华文明属于文明基本基因协调发展的文明么?
黑格尔论中华文明 “论语里面所讲的是一种常识道德,这种常识道德我们在哪里都能找到, 在哪一个民族里都能找到,可能还要好些, 这是毫无出色之点的东西。 孔子是一位世间智者, 在他那里思辨的哲学是一点也没有的—— 只有一些善良的、老练的、道德的教训, 从里面我们不能获得什么特殊的东西。”
A.C.Graham葛瑞汉论中华文明 公元前500至200年间的中国思想家,在欧洲久负盛名, 但都算不上哲学家,不过是是些伦理道德家、神秘主义者和政论家
02关于思维存在性的基本问题 问题1:印象和观念都能用自然语言来表达么? 问题2:思维存在之本是什么? 问题3:思维的表里与本末如何对应? 是表与本、里与末对应? 还是表与末、里与本对应? 还是需要其他的对应方式?
通过自然语言对思维的探索只能是一个局部性的探索, 这是问题1的答案。 03 HNC是关于思维存在性的局部探索 通过自然语言对思维的探索只能是一个局部性的探索, 这是问题1的答案。
04语言概念空间符号体系㈠ 现在 我们可以对语言交际作如下的表述: 语言交际不只是一个自然语言符号体系运用或参与的过程, 而是自然语言符号体系和语言概念空间符号体系两者交替运用或参与的过程。 语言交际存在两个过程:表达过程和理解过程, 表达过程使用自然语言符号体系, 理解过程使用语言概念空间符号体系。
04语言概念空间符号体系㈡ 而且 语言概念空间符号体系是内在物,是自我的终极载体,是交际引擎的核心, 语言符号体系是外在物,不是自我的终极载体, 而只是自我表现的手段,是交际引擎的端口。 那个看不见摸不着的语言概念空间符号体系才是思维存在之本。 这是问题2的答案。
04语言概念空间符号体系㈢ 人工智能学界没有思考过么? 计算语言学界没有思考过么? 认知心理学界没有思考过么? 语言哲学界没有思考么? 《皇帝新脑》一书没有思考过么? 乔姆斯基先生以毕生精力研究过的普适语法UG 难道不是语言概念空间符号体系么? 随意撕破窗户纸的人并不是真正的智者, 那些明白某些窗户纸不能撕破的人才是真正的智者。
05语言概念空间符号体系的探索需要新思路 第一句话是: 语言概念空间和语言概念空间符号体系是两类不同性质的研究, 第二句话是: 西方有关学界一直没有把语言概念空间符号体系的研究提上日程。
可是 自然语言理解从诞生之日起就定位于技术,而且只定位于技术, 为什么?很奇怪不是吗? 是人工智能学的创立者们不知道或忽视科学与技术的源流关系吗? 当然不是! 而是由于西方学界对语法和逻辑的深厚信赖传统。 他们误以为自然语言理解技术的科学之源就是那 古老而又青春焕发的语言学和逻辑学, 还有那大名鼎鼎的语言哲学和名目繁多的现代心理学。
人们理所当然地认定 “句法+逻辑”可以达到理解的彼岸, 至少可以达到一定程度的理解。 当这个理所当然的认定似乎走不通以后, 人们就进一步想 “语形、语义、语用三维度+逻辑”总能达到理解的彼岸吧!
但训诂学告诉我们 语形、语义和语用的三维度还需要一个统摄者, 没有这个统摄者 “三语”空间只是一个纯粹的几何空间, 而不是笛卡儿的解析几何空间, 还不能构成语言概念空间的数学物理表示式。 那么 怎样将“三语”空间变成笛卡儿空间呢? 那个统摄者究竟是什么?
许先生为什么要强调中文信息处理需要不同的流派? 因为许先生不仅看到了这一探索的深远科学技术价值和社会价值, 更深知这一探索的艰辛。 许先生的流派理念十分谦虚并留有充分余地,许先生是明智的。
说到这里 我可以来说第三句话了 这第三句话是: 语言概念空间符号体系的探索要采取 “狐狸+刺猬”的探索方式—— 那就是要构造出语言概念空间符号体系的数学物理表示式。
ABS 语言概念空间符号体系运算的最终结果就是构成一个语境, 一种以某种数据结构表达的语境, 并追求计算机得到的ABS与大脑里形成的ABS基本相当, ABS的数据结构本身实际上就是这个功能比较的具体标准。
ABS和SGU⑴ 这个语境ABS就是那语形、语义、语用三维度的统摄者。 它具有无限的具体形态, 但具有有限的结构单元, HNC把这个结构单元叫做语境单元,符号是SGU。 语言概念空间的数学物理表示式就是要写出 ABS和SGU的表示式。
ABS和SGU⑵ SGU和ABS的结构都是先验的, 先验的意思就是指他们都具有表示式, 而且ABS是SGU的函数,即ABS=f(SGU) 让我们先承认(或假定)这个函数形式的存在, 那么 需要解决什么基本科学问题呢? 第一 这个函数可以写出具体表示式么? 第二 SGU又是谁的函数?并呈现为什么样的函数形式呢?
SCD HNC把ABS的具体表示式写出来了,那就是(HNC4), HNC也把SGU的具体表示式写出来了,那就是(HNC3)。 (HNC4)表明 ABS是SCD的内容变换, (HNC3)表明 SGU是领域句类SCD的函数 于是 SCD就成了构造语言概念空间数学物理表示式的钥匙。 这把珍贵的钥匙SCD是先验的, 所谓人类百万年的进化 其天地日月之精华就是这个存在于大脑中的SCD。
SCD⑵ 那么 SCD表示式又从何而来? 它来于句类SC, 准确的陈述是:SCD是 句类SC和领域D的函数, SCD=(SC,D) HNC把句类SC穷举了,把领域D也穷举了, 这就是说 语境单元SCD的有限性来于句类SC和领域D的有限性, 这个有限性就带来语言概念空间符号体系探索的终极希望。 而这个终极希望是由语言概念空间符号体系的基层特性提供保证的。
以上 就是语言概念空间符号体系新思路的要点, 这里是这一要点的“正”说, 从语言概念空间的顶层起说,终结于基层。 它也可以“反”说, 从基层起说,终结于顶层。 HNC的实际探索旅途一直是沿着“反”说前进的, 因为我们当初并不熟悉 那“正亦反、反亦正”的正反辩证法。 因而走了不少的弯路。
06语言概念空间符号体系的HNC表示式 语言概念空间基层的HNC表示式——概念延伸结构表示式 CESE::=CT:(ICP1,BCP2;ICP2,BCP2; …) ……………………………………(HNC1) ICP =::(m//n; ekm//ekn; cmn//dmn, -0|) BCP=:(t=x; k=x: i=3//7)
(HNC1)表示式② CESE 概念延伸机构表示式 CT 概念树(Concept Tree)符号 ICP, 中层概念基元符号,后缀符号1//2…分别表示一级、二级…的意思 BCP 底层概念基元符号,后缀符号意义同上。
BCP 名称 简称 数字范围 交织延伸 t表示 9-b//8-b 并列延伸 \k表示 1//0-b 定向延伸 i表示 3//7
(HNC1)要点(语言概念空间基层、概念基元、CP 素描) (1)数量与类型的素描 概念树总量 456 核心概念树(作用效应链) 42 领域概念树(两类劳动、三类精神生活) 224 基本概念树(哲学与伦理学) 37 逻辑概念树(语法与基本逻辑) 基本物概念树(自然界、生命体、人体) 一种概念树对应一组概念延伸结构表示式 总共有456组概念延伸结构表示式
(HNC1)要点⑴: 领域信息概念树分布表
(HNC1)要点(2) 2*3种延伸结构的素描——联想类型的素描① 近程联想(局部、中层) 对比型联想 对偶型联想 黑氏对偶与非黑氏对偶 黑格尔先生醉心于对立统一性对偶,完全忽视了居于多数非黑氏对偶, 孔子曾经深刻阐释了11*2种非黑氏对偶中最重要的几种, 例如中庸的概念属于e4m,仁的概念属于e4n。 黑格尔先生对孔子的傲慢论述可以回赠于黑氏了。 包含型联想
(HNC1)要点(2) 2*3种延伸结构的素描——联想类型的素描② 远程联想(全局、底层、网络性) 交织型联想(侧面、表现、经纬之纬) 并列型联想(类型、经纬之经) 定向型联想(小一、特异点)
(HNC1)要点 (1)数量与类型的素描 (2) 2*3种延伸结构的素描——联想类型的素描 (3) 各类联想可相互串接
(HNC2) 语言概念空间第一介层的HNC表示式——句类表示式: SC=GBK1+EK+GBKm ,mmax=3 (HNC2) SCR=SC+fKm (HNC2R) 苗传江博士的专著——《HNC(概念层次网络)理论导论》
(HNC3) 语言概念空间第二介层的HNC表示式,语境单元表示式: SGUN=(DOM;SIT;BACE;BACA) (HNC3-1) SGUD=(8y:|DOM;SIT;BACE;BACA) (HNC3-2) SIT=SCD(A,B,C) | SCD=fKm|+GBK1+EK+GBKm, mmax=5 (HNC3a)
(HNC3)㈡ DOM——领域 SIT ——情景 BAC——背景 BAC[E//A]——事件//述者背景 SCD——领域句类
(HNC3)要点(语言概念空间第二介层、语境单元、SGU、短时记忆 素描)㈠ (1) 以领域DOM为纲,以领域句类代码SCD为目 (2) 领域句类代码SCD仍然是基本句类的组合, (3) 领域句类代码SCD所包含的信息是语境单元的关键信息。
(HNC3)要点㈡ (4) 由于领域的介入 SCD的各语义块之间的关联信息十分清晰, 这些十分清晰的信息是先验的, 并且是可以给出关联表示式的。 (5) 语境单元在语言概念空间与一个特定的延伸概念对应。 (6) 语境单元与自然语言的句群对应。 (7) 语境单元就是短时记忆的数学模式。
(HNC4) 语言概念空间顶层的HNC表示式表示式——语境框架表示式: ABS=(BCN//BCD;XYN,XYD,PT,RS;BACEm;BACAm) …………………… (HNC4) BCN//BCD——对象与内容的叙述//论述 XYN//XYD——作用与效应的叙述//论述 PT——过程与转移的描述 RS——关系与状态的描述
(HNC4)要点(语言概念空间顶层、语境框架、ABS、记忆 素描) (1) 以对象与内容BC为纲,以作用效应链为目。 (2) 区分叙述与论述 (3) 将内容进行作用与效应XY、过程与转移PT、关系与状态RS的分解(转换) (4) 把事件背景BACE和作者背景BACA区别开来。 (5) 语境框架就是“语言”记忆的模式 (6) 语境框架与自然语言的篇章对应
07《全书》概貌 《全书》大纲 《全书》分3卷 第一卷 6编 第一编 主体基元概念(作用效应链) 0-5 第一卷 6编 第一编 主体基元概念(作用效应链) 0-5 第二编 第一类精神生活 (71,72,73),8 第三编 第二类劳动 a 第四编 第三类精神生活 b,d 第五编 第一类劳动 q6 第六编 第二类精神生活 q7,q8
《全书》概貌㈡ 第二卷6编 第一编 基本哲学概念 j0-j6 第二编 基本属性概念 j7,j8 第三编 基本逻辑概念 jl 第五编 语习逻辑概念 f 第六编 综合逻辑概念 s
《全书》概貌㈢ 第三卷4编 第一编 概念属性总论 第二编 五元组与词类 第三编 语义块与句类 第四编 领域句类与语境单元
《全书》概貌 卷——编——(篇)——章——节——小节——(子节)——(段) 章与概念林对应 节与概念树对应 前两卷共计456节 《全书》的理论基础——HNC1 《全书》的M论述和P论述
08概念延伸结构表示式示例 示例1 示例2 示例3
09我只承担《全书》的M论述 09-1 M论述示例 09-2 年龄与M论述 09-3 梦中之梦
句类分析的20项难点(上) 01 特征语义块EK多句类代码的选定 02 全局语句(简记为EgJ)与局部//蜕化语句 (简称句蜕,简记为ElJ)的判定(多动词难点) 03 含LS语句与复句的判定 04 广义对象语义块多元逻辑组合的分析 05 Ek//EK复合构成与分离的分析 06 以指代和句间接应词语为代表的浅层隐知识揭示 07 无EK语句的句类辨认 08 广义对象语义块GBK分离现象的分析 09 逗号功能的判定
句类分析的20项难点(下) 10语义块主辅变换的分析 11句类转换的分析 12特殊块扩的辨认 13复杂因果句的识别 14体词多义的选定 15 以复杂省略和想象描述为代表的深层隐知识揭示 16 语句违例格式的判定(汉语多见,下同) 17 动词体词化的识别 18 动态组合词的识别与语义认定 19 分词消歧 20 伪词鉴伪(汉语特有)
满庭芳(七十抒怀之三)(上) 九斋时节,毛公稍息,可闻马老浮夸注1。 意指巅峰,杨李小惊讶注2。 无奈英雄时势注3,书生劫,井底群蛙。 北流停,已然不惑,惜别好年华。 注1 马寅初校长敢直言,但亦有浮夸。当时大学生吃饭不要钱,但马老在第一届人代会上说“北大学生每人每日四两肉”,则言犹在耳之浮夸也。 注2 杨振宁李政道的诺贝尔奖不过尔尔。 注3 毛泽东<=>“英雄造时势”,邓小平<=>“时势造英雄”,故下阕有“时势英雄日”。
满庭芳(七十抒怀之三)(下) 时势英雄日,奋酬壮志,何惧天涯注4。 甘霍张侯浩 小露奇葩。 最幸秉乾不老,燕园聚,悲喜皆佳。 甘霍张侯浩 小露奇葩。 最幸秉乾不老,燕园聚,悲喜皆佳。 古稀来,再猷卅载,潇洒比当娃。 注4 天涯1<=>“同是天涯沦落人”;天涯2<=>目标更远了,似在天涯。
葛瑞汉 纳什 霍金 尼采 凯恩斯 熊十力 利科 休谟 李幼蒸 雅斯贝尔斯 蒙田 俞允强
08概念延伸结构表示式示例1 基本作用00的概念延伸结构表示式 00:(t=a,m,3,\k=5;9α=a,at=b,m3,3t=a;) 009 物质作用 00a 精神作用 003 作用的链式表现 00m 作用的基本特性 001 吸引 002 排斥
示例1⑵ 00\k=5 作用基本效应的形而上描述 00\1 效应的存在性描述 00\2 效应的功能性描述 00\3 效应的量质度描述 00\1 效应的存在性描述 00\2 效应的功能性描述 00\3 效应的量质度描述 00\4 效应的双对象描述 00\5 效应的综合性描述
示例1⑶ 003t=a 作用链式表现的基本形态 0039 缘起性形态 003a 强制性形态 003t典型词语: 0039 缘起性形态 003a 强制性形态 003t典型词语: 0039:使//令//叫//让//使得 003a:逼//迫使//逼迫//强迫
08概念延伸结构表示式示例2 人之状态50a的概念延伸结构表示式 50a:(t=a,e5n,e7m,i,\k=4;(t)7,)
示例2 ⑵ 50ae7m 人之状态的能动性表现 50ae71 勤劳 50ae72 懒惰 50ae73 懈怠 50ai 人之状态的传统表现 50a\k 人之状态的特定作用效应链表现 50a\1 特定状态 50a\2 特定关系 50a\3 特定效应 50a\4 特定过程
示例2⑶ 生活50a9具有下面延伸结构表示式: 50a9:(t=a,\k=3,3;at=b,3\k=2) 50a9t=a 生活两侧面
08概念延伸结构表示式示例3 劳动50aa具有下面的延伸结构和概念关联表示式: 50aat=a 劳动两侧面 50aa9 劳动第一侧面 (50aa9=:q6;50aa9==q6) (劳动第一侧面等同于第一类劳动,是第一类劳动的虚设概念) (50aaa=:a; 50aaa==a) (劳动第二侧面等同于第二类劳动,是专业活动的虚设概念)
示例3⑵ 50a9at=b 精神生活的层级表现 50a9a9 第一层级精神生活 50a9aa 第二层级精神生活 50a9ab 第三层级精神生活
示例3⑶ 精神生活50a9a具有下面的基本概念关联式: 50a9a9:=(71,72,73,8) (第一层级精神生活对应于第一类精神生活) 50a9aa:=(q7,q8) (第二层级精神生活对应于第二类精神生活) 50a9ab:=(b,d) (第三层级精神生活对应于第三类精神生活)
示例3⑷ 人之状态基本侧面50at=a关涉到全部扩展基元概念 即人类的两类劳动和三类精神生活, 显然 与扩展基元概念直接有关的延伸概念可以在这里被安置成虚设概念, 其语境信息将由扩展基元概念来提供。 但是 50at的非虚设概念将承担着直接提供相应语境信息的功能
09我只承担《全书》的M论述 09-1 M论述示例 09-2 年龄与M论述 09-3 梦中之梦
09-1 M论述示例 《老子》第二十五章说:有物混成,先天地生。寂兮寥兮,独立而不改,周行而不殆,可以为天地母。吾不知其名,强字之曰“道”,强为之名曰“大”,大曰逝,逝曰远,远曰反。 更多……
09-2 年龄与M论述① 乔治·华盛顿大学的基尼·科恩博士说: 大脑在面临衰老挑战的时候,会产生出一种称为“树枝状结晶”的新物质。 50-70之间,这种物质会在我们大脑的信息处理单元中一直蓬勃生长。 (创造力高峰可在晚年)
09-2 年龄与M论述② (创造性就是用非同寻常的方式将普通的信息整合起来的过程) “对信息进行概念化加工的进化后,人就从自然界脱离出来了。 也就是人在能够进行反思时,她就从动物界独立出来了。 她就有了意识、有了时空观、有了内心世界、开始有了语言、 有了梦、有了对未来的想望、有了艺术、也有了迷信, 人类的文明进程也就由此时开始了。” (创造性就是用非同寻常的方式将普通的信息整合起来的过程)
09-2 年龄与M论述③ “右脑通常主管视觉,左脑则主管语言, 脑内的海马状突起专门进行信息处理和回忆。 很多创造性的想法需要左右脑和海马状突起的配合。” (汉语有利于左右脑的协同)
09-2 年龄与M论述④ 洛杉矶加利福尼亚大学弗里德博士最近的一项研究发现, 人脑的单个细胞似乎也能认出名人。 …人脑似乎只用相对较少的几个细胞来记录它所看到的物体。 这与大脑是用一个庞大的系统来进行记忆的想法形成了鲜明的对比 (“脑细胞‘认出’名人”)
09-2 年龄与M论述⑤ 大脑是尚未破译的黑匣子, 迄今为止的经济学理论都假定,这个黑匣子的运作细节永远不会为人所知。 最近出现神经经济学将放弃这一假定。 利用大脑扫描仪有可能直接测量思想和情感的活动。
09-3 梦中之梦 神学和哲学的探索主宰了农业时代, 科学和技术的探索主宰了工业时代, 人类正在进入后工业时代, 后工业时代的当下 技术与工程居于主宰地位, 这肯定是一个极不正常的状态。 这个不正常状态必将导致人类的退化和蜕化。 人类社会需要一个把培育健全的文明基因作为首要目标的时代, 这个时代一定会来临,虽然21世纪绝对没有希望。 《HNC理论全书》将为文明基因的探索做一点点训诂的工作, 这是《HNC理论全书》的梦中之梦, 也是我在这个报告里最想说的一句话。