热搜:南怀瑾 |证严上人

分类浏览



数据索引与数据组织模型及其应用
作者:
胡运发 著
定价:
30 元
页数:
204页
ISBN:
978-7-309-08694-2/T.442
字数:
335千字
开本:
16 开
装帧:
平装
出版日期:
2012年7月       
本类其他相关图书

内容提要


       本书是面向海量数据处理的属于数据与知识工程范畴的学术专著。本书从数据组织的观点处理数据索引问题,提出一种互关联后继索引的商空间模型,从数学变换角度论证该模型优越于现有经典索引模型的多种特性:保序,睦、保假性和压缩性,导出多种优越能力: (1)log级的快速查询能力;(2)原文生成能力; (3)高度的压缩能力。
       本书以互关联后继索引模型为中心,与多种领域的核心问题相结合,说明该模型如何对数据压缩、全文数据库、关系数据库、Web数据库、演绎数据库、知识库、文本信息隐藏、数据挖掘等领域产生创新性的影响,从而生成一系列新成果。
       本书对从事关系数据库、Web数据库、事务库、演绎数据库、知识库、逻辑语言、搜索引擎、数据云、数据压缩、文本分类、数据挖掘等领域的研究人员、工程技术人员、高等院校的教师与学生有重要的参考价值或借鉴作用。

作者简介


       胡运发,1964年复旦大学数学系毕业,后任该校计算机系教授,博士生导师。研究方向是数据、知识工程与知识库、创建新型数据索引与数据组织模型。 曾参加我国银河亿次计算机的研制工作、逻辑语言Prolog的开发、智能计算机的研制,承担 “八六三”项目六次,国家自然科学基金项目四次,参加国家自然科学基金重点项目两次。期间获得电子工业科技进步二等奖(1986)、国防科工委科技进步一等奖(1994)及二等奖两次、中国人民解放军三等功一次、上海科技进步奖二等奖6项。发表论文100余篇,翻译出版《剑桥五重奏》(上海科技出版社2003,获得牛顿科技普及二等奖),编著教材《数据与知识工程导论》(清华大学出版社,2003)及《人工智能系统原理与设计》(国防科技大学出版社,1989)。获得与本专著有关的国家专利一项(2000)。
      

书摘


       目录
      
       上篇
      
       第一章 第一后继字符有序的互关联后继树索引模型3
      
       1.1全文检索模型综述
       1.1.1位图(Bitmap)
       1.1.2署名文件(Signature Files)
       1.1.3倒排表(Inverted Files)
       1.1.4Pat树和Pat数组
       1.1.5∑2相邻矩阵模型
       1.1.6全文索引模型的评价标准
       1.2第一后继字符有序的互关联后继树
       1.2.1基本定义
       1.2.2后继区间概念介绍
       1.2.3创建第一后继有序的互关联后继树创建算法
       1.3后继区间查询算法
       1.4后继区间查询算法复杂度及其性能分析
       1.5实验与分析
       1.6小结
      
       第二章 双排序互关联后继树创建与查询算法
       2.1引言
       2.2双有序互关联后继树索引创建算法
       2.3双排序互关联后继树查询算法
       2.3.1逆向区间二分查询算法
       2.3.2双排序互关联后继树二分验证查询算法
       2.3.3双排序互关联后继树线性优化查询算法
       2.4实验与分析
      
       第三章 互关联后继树索引的编码优化方法
       3.1引言
       3.2编码方案
       3.3位编码算法
       3.4原文生成算法
       3.4.1字符定位算法
       3.4.2后继树编码计数算法
       3.4.3后继树编码值算法
       3.4.4原文根地址算法
       3.4.5原文生成算法
       3.5全文检索算法
       3.6实验数据及分析
       3.7小结
      
       第四章 基于互关联后继树索引的文本压缩
       4.1文本数据压缩的常用技术
       4.1.1数据压缩
       4.1.2文本压缩技术的分类
       4.1.3几种主要的压缩模型
       4.1.4文本压缩技术的应用
       4.1.5压缩的评判标准
       4.2后继树静态词典压缩
       4.2.1互关联后继树静态词典的设计
       4.2.2压缩和解压算法
       4.2.3静态词典压缩算法改进
       4.2.4性能比较与分析
       4.3互关联后继树自适应词典压缩
       4.3.1互关联后继树自适应词典的设计
       4.3.2压缩和解压算法
       4.3.3压缩算法改进
       4.3.4互关联后继树自适应压缩算法特点
       4.3.5性能比较与分析
       4.3.6小结
      
       第五章 基于后继模式树的XML索引模型
       5.1引言
       5.2基于后继模式树的倒向XML索引
       5.3XML的统一索引模型
       5.3.1联合索引的创建
       5.3.2XML数据与全文数据的协同查询
       5.4XPath的自顶向下与自底向上查询
       5.4.1绝对位置路径的查询树解析
       5.4.2自顶向下查询
       5.4.3自底向上查询
       5.5基于后继模式树的协同查询
       5.5.1后继模式树上的路径查询
       5.5.2基于后继模式树的自底向上协同查询
       5.6系统实现与实验
       5.7小结
      
       第六章 基于互关联后继模型的搜索引擎
       6.1引言
       6.1.1搜索引擎的原理
       6.1.2主流搜索引擎介绍
       6.1.3黄页搜索引擎基本需求
       6.2基于互关联后继索引的搜索引擎
       6.2.1搜索引擎与互关联后继树的结合
       6.2.2互关联后继树搜索引擎的索引结构
       6.3匹配度计算
       6.3.1匹配度定义
       6.3.2匹配度计算公式
       6.3.3匹配度计算实现技术
       6.3.4词位置号的保存
       6.3.5匹配度计算
       6.3.6实验与分析
       6.4搜索结果排序技术
       6.4.1通用排序算法介绍
       6.4.2基于动态划分的多权值快速排序
       6.4.3基于区间的划分算法
       6.5小结
      
       下篇
      
       第七章 序列文本索引的粒子模型
       7.1引言
       7.2文本索引的粒子模型
       7.2.1序列对象有序化
       7.2.2有序化的序列对象粒子化
       7.2.3有序化的序列对象粒子的结构关系
       7.3互关联后继索引—文本序列商空间Istr1, 2的性质
       7.3.1商空间的熵的性质
       7.3.2保假性与保序性
       7.3.3Istr1, 2的特殊性质
       7.4小结
      
       第八章 创建索引模型的数学方法
       8.1创建全文索引模型的数学变换
       8.2互关联后继索引模型性能分析与比较
       8.2.1倒排表和Pat数组的性能分析
       8.2.2互关联后继索引模型性质
       8.2.3分析与比较
       8.3存储模型比较分析
       8.3.1原文和索引都在内存
       8.3.2原文在外存索引放置于内存的情况
       8.3.3原文和索引都放置于外存的情况
       8.4与Pat树等其他索引模型的关系
       8.5小结
      
       第九章 互关联后继索引模型的熵与压缩原理
       9.1引言
       9.2粒子细分的方法不能降低信息量
       9.3公因子方法压缩原理
       9.4差异熵压缩的原理
       9.4.1一元编码
       9.4.2Golomb方法
       9.4.3编码模式方法和实例
       9.5小结
      
       第十章 事务库的组织与数据挖掘
       10.1FP-Growth方法简介
       10.2隐式互关联间接后继树/图的挖掘方法
       10.2.1隐式互关联间接后继树(/图)表示
       10.2.2ISTR+树创建算法
       10.2.3Istr+树频繁项集挖掘算法
       10.2.4Istr+树挖掘算法与FP-growth算法的比较
       10.3可变维数的隐式间接互关联后继树的挖掘方法
       10.3.1可变维数的隐式间接互关联后继树表达
       10.3.2T-Istr+间接后继表的性质与频繁项的挖掘算法
       10.3.3算法复杂性分析
       10.4小结
      
       第十一章 关系数据库与演绎数据库的数据组织
       11.1协同查询问题的回顾
       11.2关系的互关联后继的数据表达
       11.3关系RIstr+互关联隐式间接后继索引表与演算
       11.3.1基于RIstr+索引表的关系演算
       11.3.2RIstr+查询操作的复杂性分析
       11.4基于RIstr+的关系库的协同查询
       11.5演绎数据库的索引与演绎
       11.5.1演绎数据库的索引
       11.5.2基于I-Istr+的基本查询算法(集合查询算法)
       11.5.3演绎数据库的演算
       11.5.4对规则的演算
       11.5.5复杂性的对比
       11.6小结
      
       第十二章 逻辑程序或知识库的索引
       12.1逻辑程序的简单介绍[Hu88]
       12.2严格有序的逻辑程序的索引模型
       12.2.1第一种函词的序列表示
       12.2.2创建逻辑子句索引的步骤
       12.2.3互关联后继树索引与Warren抽象机数据的关系
       12.2.4基于互关联后继索引的合一操作——索引合一
       12.2.5推理步骤说明
       12.2.6子句的或并行
       12.2.7串行执行机制的改进——子目标级别优选
       12.3逻辑程序并行性
       12.3.1第二种函词表示方法
       12.3.2创建互关联后继索引的步骤
       12.3.3合一中的并行
       12.3.4逻辑程序并行推理的实例
       12.4结论
      
       第十三章 基于互关联后继数据组织模型的文本信息隐藏技术
       13.1引言
       13.2相关技术与术语介绍
       13.2.1术语介绍
       13.2.2相关技术介绍
       13.3基于互关联后继索引模型的文本信息隐藏方法
       13.3.1信息隐藏过程
       13.3.2信息提取过程
       13.3.3控制功能
       13.4安全强度分析
       13.5小结
      
       参考文献

书评       

   

地址:上海市国权路579号
邮编:200433
电话:021-65642854(社办)
传真:021-65104812

 
 

版权所有©复旦大学出版社,2002-2024年若有问题请与我们 (webmaster@fudanpress.com) 联系! 沪ICP备05015926号