本书系统性地介绍了多个经典的和前沿的机器学习技术及其在文本域中的应用。首先, 详细介绍了面向文本数据的预处理技术和经典的机器学习技术 (如矩阵分解与主题建模、聚类与分类/回归等), 并深入探讨了模型的原理和内在联系以及相应的性能评估; 其次, 详细介绍了结合异构数据的文本学习技术 (如知识共享与迁移学习等), 以及面向信息检索与排序的索引和评分等技术; 最后, 详细介绍了一些文本应用相关的重要技术, 包括序列建模与深度学习、文本摘要与信息提取、意见挖掘与情感分析、文本分割与事件检测等。本书从技术原理到实际应用, 综合梳理了文本机器学习的多个技术, 深入分析了模型的优缺点和内在联系; 并在每章结束时提供了详细的参考资料、软件资源和习题。