Download presentation
Presentation is loading. Please wait.
1
共享文化大数据的新机制 李幼平 杨 鹏 2013年4月
2
追求“内容自寻读者” 万维网(World Wide Web)是“博大精深”的文化大数据,它与个人的有限需求之间,缺乏顺从人意的直达机制
本文建议,定义最小内容基元,并借助泛在无线电广播,创造“内容自寻读者”的主动服务机制 新机制不但能大比例分担核心网的共享类流量,而且有望从国家层面找到保证公共内容安全的有效措施
3
共享文化的三个科学问题 奥巴马政府又出了“大数据”的题目,要求科学家从大数据中萃取有价值的信息,并从国家层面找到保证信息安全的有效措施。
中国政府发出“用好互联网,管好互联联网”的号召,提倡用“三网融合”营造“国家公共文化服务体系”。 无论“大数据战略”还是“公共文化战略”,提法虽然不同,最终都希望实现全民对文化大数据的科学享用,都需要回答三个科学问题: 1,共享如何不限人数? 2,服务如何匹配个人? 3,国家如何依法治理? 试图借助网络物理变革回答问题
4
无线复制体现网络物理变革 无线电广播轻松回答三个问题中的两个 无线电是“一点对无限点”的单向电磁辐射
“无限点”意味着支持“共享不限人数”,不管多少人分享电磁波带来的数据,永无“带宽拥塞” “一点”支持内容集结一体,在卫星实施分发的过程中,国家自然获得理顺内容和依法管理的机会 唯一障碍:单向系统没有互动环节,难以匹配个人 广播内容自带互动环节,障碍将出现重大突破 具体办法是,文件前缀嵌入沟通读者与作者的语义短包作为取舍内容的文化基元,让作者与读者在网络终端实现直接互动
5
自帯互动环节:1kB内容标签 毕升把汉字当成是可按语义聚分的最小文化基元;网络需要可按语义取舍的最小文化基元UCL
UCL(Uniform Content Label)统一内容标签 表达读者喜好 (个人常用网站、栏目, 或感兴趣的专业话题) 5B 1 KB 表达作者语义 (描述内容的要义) 支持依法管理 (国家授权,科学管理) 8B 1B 2B 16B 64B ~100B ~128B ~600B 网站 栏目 专业话题 时间戳 内容代码 内容标题 内容要义 内容出处指纹 内容指纹 待定
6
UD Radio 定义泛在广播 无线电波转瞬即逝,“泛”而“不常在” 存储和内容匹配技术帮助它成为
anywhere、anytime、anyone 的 Ubiquitous Data Radio UD Radio
7
发明超级门户机制 内容标签UCL含有标题、摘要,本身是一种可读的短文件
把大量网站的UCL短文件集结一体,形成海含众多网站主页的“超级门户”(super portal) 其他媒体都是“零阶”的,唯独它是“高阶”的 超级门户是“有关数据的数据”(data about data),是“引领众多媒体的超级媒体”(medium about media) 集结后的UCL内容品种足够多,千差万别的个人都可以从中得到个性需求的提醒;集结后的总字节量又足够地小,只需用一个低速率的广播信道,就足以承载多元内容面向全民的泛在服务。
8
广科院的低码率UD Radio 广播科学研究院发明一种调频波段的低码率OFDM信道,形成穿墙入户“直达所有网络的所有终端”的物理能力。
由于码速率很低,接收环节是一种功耗极低的嵌入式小芯片,很容易寄生于PC机、TV机、Pad机、手机的主芯片之中 UD Radio每天把百万种UCL数据包直接存入任意网络的任意终端,广大民众可以在第一时间免费得到任意媒体的任意标题摘要。 从工程上体现主动服务的超级门户机制。
9
图3 Internet的边缘增添泛在广播的次结构
互联网边缘增添广播结构 图3 Internet的边缘增添泛在广播的次结构
10
减少内容分发跳数 “小世界”的说法起源于Milgram的“六度分离”猜想,即全球几十亿人中的任意一人,经过五次中间介绍,总可以找到另一位陌生的人。 1998年,Watts等人在NATURE杂志上发表题为“Collective Dynamics of ‘Small-World’ Network”的论文,指出聚类动力学是小世界的成因。 对获取网页的平均路由跳数D进行实测统计,得知WWW网络90%以上网页的 D在 6与 23之间。
11
出现D~lnlnN超小世界 2009年PHYSICAL REVIEW LETTERS杂志发表题为“Navigating Ultrasmall Worlds in Ultrashort Time”的文章 指出当幂指数γ处于2至3之间时,采用贪婪路由可使网络的D~lnlnN,并可实现超短时间的内容引导。 其中N为网络节点总数量,取N等于全球人口70亿,则可算得D~3,超越了原先“六度分离”的猜想,实现了“超小世界”和“超快引导”。 这是一个了不起的理论工作,激励中国专家坚定信心,朝着更小跳数的目标继续前进。
12
东南大学D~1的梦想 东南大学团队发现,直接关联复杂网络理论的“度分度”和“平均程长”,有可能通过简单的内容匹配计算而不是通过复杂的路由计算实现更小的平均跳数 或者说,迫近D~1的更高理想。 为了实现这一目标,未来网络只需要在基于对流的Internet主结构的边缘,添加如图3所示的辐射复制的泛在广播次结构B-C-S。
13
流量的边缘分担机制 泛在广播次结构形成流量的边缘分担机制,内容共享类业务将被D~1单跳互动分担
D~1有利于IP核心网化解“十年千倍”的扩展性困惑。同时 D~1,意味着攻击者只能在局域网内做坏事,攻击成本提升,防卫成本下降。 D~1,意味着提升QoS主要只需改善最后一跳的带宽,而不是核心网络的带宽。 D~1,意味减免高速路由计算和高速搜索计算的能耗。
14
支持内容依法管理 利用Hash函数产生一个加密“检查和”,若遭篡改“检查和”将异样,内容即被视为非法。
在IP环境中,Hash指纹仍然存在安全漏洞。我们建议改用UCL格式通过卫星转发Hash指纹。 卫星转发是一种难以施加攻击的非开放物理信道,UCL的时戳又具有“时不再来”的唯一性,同时篡改指纹与内容,几乎是不可能的。 国家注册机构卫星发放的哈希指纹,任何地点上的任何终端,都有可能在域名和路由均不可信的情况下,直接判断公共内容的真伪,保护公共内容的安全,确保国家长治久安。
15
Cyberspace 矢量化 中国领先全球,首创公益、基本、均等、方便的大文化:公共文化服务体系
假设1kByte为文化数据单位模量,用1kByte的语义短数据包 UCL作为单位矢量,直接沟通作者与读者的意向,把人的因素植入网络 单位矢量通过无线电辐射治理中国互联网,理顺杂乱无序的文化大数据,用尽可能少的路由跳数,把有价值的内容分发给每一位个人 中国领先全球,首创公益、基本、均等、方便的大文化:公共文化服务体系
16
结束语 治理互联网的全新手段已经初见端倪? 无线电是一种“一点对无限点”的电磁辐射
它支持国家对文化大数据的科学管理,支持文件主动寻找需要它们的用户 全国老百姓,地不分南北,人不分贫富,每一个人都有机会就近获取个人有兴趣的文化内容 内容标签UCL促成广播网、电信网双双成为互联网的基础设施,自然铸就三网融合的技术框架 请教大家: 治理互联网的全新手段已经初见端倪?
Similar presentations