数据索引与数据组织模型及其应用/胡运发著/复旦大学出版社


首页出版社介绍简介发展沿革图书推荐新书推荐重点推荐丛书（系列书）推荐书评与书摘新闻中心出版社新闻媒体关注产业资讯党务工会党务信息工会信息团务信息与我们联系个人读者购书团体及批销单位购书院校合作部联系信息相关服务导航复旦图书真伪查询教学服务网官方天猫旗舰店 English
	热搜：南怀瑾 \|证严上人

分类浏览

品牌教材

复旦博学品牌

复旦卓越品牌

	数据索引与数据组织模型及其应用
	作者：	胡运发著
	定价：	30 元	页数：	204页
	ISBN：	978-7-309-08694-2/T.442	字数：	335千字
	开本：	16 开	装帧：	平装
	出版日期：	2012年7月	本类其他相关图书
内容提要
本书是面向海量数据处理的属于数据与知识工程范畴的学术专著。本书从数据组织的观点处理数据索引问题，提出一种互关联后继索引的商空间模型，从数学变换角度论证该模型优越于现有经典索引模型的多种特性：保序，睦、保假性和压缩性，导出多种优越能力： (1)log级的快速查询能力；(2)原文生成能力； (3)高度的压缩能力。本书以互关联后继索引模型为中心，与多种领域的核心问题相结合，说明该模型如何对数据压缩、全文数据库、关系数据库、Web数据库、演绎数据库、知识库、文本信息隐藏、数据挖掘等领域产生创新性的影响，从而生成一系列新成果。本书对从事关系数据库、Web数据库、事务库、演绎数据库、知识库、逻辑语言、搜索引擎、数据云、数据压缩、文本分类、数据挖掘等领域的研究人员、工程技术人员、高等院校的教师与学生有重要的参考价值或借鉴作用。
作者简介
胡运发，1964年复旦大学数学系毕业，后任该校计算机系教授，博士生导师。研究方向是数据、知识工程与知识库、创建新型数据索引与数据组织模型。曾参加我国银河亿次计算机的研制工作、逻辑语言Prolog的开发、智能计算机的研制，承担 “八六三”项目六次，国家自然科学基金项目四次，参加国家自然科学基金重点项目两次。期间获得电子工业科技进步二等奖(1986)、国防科工委科技进步一等奖(1994)及二等奖两次、中国人民解放军三等功一次、上海科技进步奖二等奖6项。发表论文100余篇，翻译出版《剑桥五重奏》(上海科技出版社2003，获得牛顿科技普及二等奖)，编著教材《数据与知识工程导论》(清华大学出版社，2003)及《人工智能系统原理与设计》(国防科技大学出版社，1989)。获得与本专著有关的国家专利一项(2000)。
书摘
目录上篇第一章第一后继字符有序的互关联后继树索引模型3 1.1全文检索模型综述 1.1.1位图（Bitmap） 1.1.2署名文件（Signature Files） 1.1.3倒排表（Inverted Files） 1.1.4Pat树和Pat数组 1.1.5∑2相邻矩阵模型 1.1.6全文索引模型的评价标准 1.2第一后继字符有序的互关联后继树 1.2.1基本定义 1.2.2后继区间概念介绍 1.2.3创建第一后继有序的互关联后继树创建算法 1.3后继区间查询算法 1.4后继区间查询算法复杂度及其性能分析 1.5实验与分析 1.6小结第二章双排序互关联后继树创建与查询算法 2.1引言 2.2双有序互关联后继树索引创建算法 2.3双排序互关联后继树查询算法 2.3.1逆向区间二分查询算法 2.3.2双排序互关联后继树二分验证查询算法 2.3.3双排序互关联后继树线性优化查询算法 2.4实验与分析第三章互关联后继树索引的编码优化方法 3.1引言 3.2编码方案 3.3位编码算法 3.4原文生成算法 3.4.1字符定位算法 3.4.2后继树编码计数算法 3.4.3后继树编码值算法 3.4.4原文根地址算法 3.4.5原文生成算法 3.5全文检索算法 3.6实验数据及分析 3.7小结第四章基于互关联后继树索引的文本压缩 4.1文本数据压缩的常用技术 4.1.1数据压缩 4.1.2文本压缩技术的分类 4.1.3几种主要的压缩模型 4.1.4文本压缩技术的应用 4.1.5压缩的评判标准 4.2后继树静态词典压缩 4.2.1互关联后继树静态词典的设计 4.2.2压缩和解压算法 4.2.3静态词典压缩算法改进 4.2.4性能比较与分析 4.3互关联后继树自适应词典压缩 4.3.1互关联后继树自适应词典的设计 4.3.2压缩和解压算法 4.3.3压缩算法改进 4.3.4互关联后继树自适应压缩算法特点 4.3.5性能比较与分析 4.3.6小结第五章基于后继模式树的XML索引模型 5.1引言 5.2基于后继模式树的倒向XML索引 5.3XML的统一索引模型 5.3.1联合索引的创建 5.3.2XML数据与全文数据的协同查询 5.4XPath的自顶向下与自底向上查询 5.4.1绝对位置路径的查询树解析 5.4.2自顶向下查询 5.4.3自底向上查询 5.5基于后继模式树的协同查询 5.5.1后继模式树上的路径查询 5.5.2基于后继模式树的自底向上协同查询 5.6系统实现与实验 5.7小结第六章基于互关联后继模型的搜索引擎 6.1引言 6.1.1搜索引擎的原理 6.1.2主流搜索引擎介绍 6.1.3黄页搜索引擎基本需求 6.2基于互关联后继索引的搜索引擎 6.2.1搜索引擎与互关联后继树的结合 6.2.2互关联后继树搜索引擎的索引结构 6.3匹配度计算 6.3.1匹配度定义 6.3.2匹配度计算公式 6.3.3匹配度计算实现技术 6.3.4词位置号的保存 6.3.5匹配度计算 6.3.6实验与分析 6.4搜索结果排序技术 6.4.1通用排序算法介绍 6.4.2基于动态划分的多权值快速排序 6.4.3基于区间的划分算法 6.5小结下篇第七章序列文本索引的粒子模型 7.1引言 7.2文本索引的粒子模型 7.2.1序列对象有序化 7.2.2有序化的序列对象粒子化 7.2.3有序化的序列对象粒子的结构关系 7.3互关联后继索引—文本序列商空间Istr1, 2的性质 7.3.1商空间的熵的性质 7.3.2保假性与保序性 7.3.3Istr1, 2的特殊性质 7.4小结第八章创建索引模型的数学方法 8.1创建全文索引模型的数学变换 8.2互关联后继索引模型性能分析与比较 8.2.1倒排表和Pat数组的性能分析 8.2.2互关联后继索引模型性质 8.2.3分析与比较 8.3存储模型比较分析 8.3.1原文和索引都在内存 8.3.2原文在外存索引放置于内存的情况 8.3.3原文和索引都放置于外存的情况 8.4与Pat树等其他索引模型的关系 8.5小结第九章互关联后继索引模型的熵与压缩原理 9.1引言 9.2粒子细分的方法不能降低信息量 9.3公因子方法压缩原理 9.4差异熵压缩的原理 9.4.1一元编码 9.4.2Golomb方法 9.4.3编码模式方法和实例 9.5小结第十章事务库的组织与数据挖掘 10.1FP-Growth方法简介 10.2隐式互关联间接后继树/图的挖掘方法 10.2.1隐式互关联间接后继树（/图）表示 10.2.2ISTR+树创建算法 10.2.3Istr+树频繁项集挖掘算法 10.2.4Istr+树挖掘算法与FP-growth算法的比较 10.3可变维数的隐式间接互关联后继树的挖掘方法 10.3.1可变维数的隐式间接互关联后继树表达 10.3.2T-Istr+间接后继表的性质与频繁项的挖掘算法 10.3.3算法复杂性分析 10.4小结第十一章关系数据库与演绎数据库的数据组织 11.1协同查询问题的回顾 11.2关系的互关联后继的数据表达 11.3关系RIstr+互关联隐式间接后继索引表与演算 11.3.1基于RIstr+索引表的关系演算 11.3.2RIstr+查询操作的复杂性分析 11.4基于RIstr+的关系库的协同查询 11.5演绎数据库的索引与演绎 11.5.1演绎数据库的索引 11.5.2基于I-Istr+的基本查询算法（集合查询算法） 11.5.3演绎数据库的演算 11.5.4对规则的演算 11.5.5复杂性的对比 11.6小结第十二章逻辑程序或知识库的索引 12.1逻辑程序的简单介绍［Hu88］ 12.2严格有序的逻辑程序的索引模型 12.2.1第一种函词的序列表示 12.2.2创建逻辑子句索引的步骤 12.2.3互关联后继树索引与Warren抽象机数据的关系 12.2.4基于互关联后继索引的合一操作——索引合一 12.2.5推理步骤说明 12.2.6子句的或并行 12.2.7串行执行机制的改进——子目标级别优选 12.3逻辑程序并行性 12.3.1第二种函词表示方法 12.3.2创建互关联后继索引的步骤 12.3.3合一中的并行 12.3.4逻辑程序并行推理的实例 12.4结论第十三章基于互关联后继数据组织模型的文本信息隐藏技术 13.1引言 13.2相关技术与术语介绍 13.2.1术语介绍 13.2.2相关技术介绍 13.3基于互关联后继索引模型的文本信息隐藏方法 13.3.1信息隐藏过程 13.3.2信息提取过程 13.3.3控制功能 13.4安全强度分析 13.5小结参考文献
书评



	地址:上海市国权路579号邮编:200433 电话:021-65642854(社办) 传真:021-65104812

	版权所有©复旦大学出版社,2002-2025年，若有问题请与我们 (webmaster@fudanpress.com) 联系！沪ICP备05015926号