海量文本数据的多维挖掘

本书介绍在少量的监督下将非结构化数据转化为多维知识的文本立方体框架。该框架先通过一个立方体构造算法将非结构化数据转化为多维的、多粒度的立方体结构, 再通过一个立方体开发算法提取立方体空间中的多维知识。本书提出的方法为从非结构化数据中获取知识提供了一种新的思路。本书分为两部分: 第一部分详述立方体构造部分的原理和实现, 第二部分详述立方体开发部分的原理和实现。此外, 本书还给出了一些应用示例。