全书内容共分为9章。第1章详细介绍了数据整理的重要性, 明确了Python数据整理工作中的重点, 并介绍了Python的基本数据结构及其实现; 第2章是本书的基础, 阐述了Python中的高级数据结构和操作系统的文件操作功能; 第3章着重描述了Python中NumPy、pandas和Matplotlib三个基本库的基础知识; 第4章深入介绍了pandas DataFrame的相关知识; 第5章介绍了应用于现实生活的网页抓取的数据整理技术; 第6章提出现实生活中发生的数据问题, 并学习如何解决这些问题; 第7章学习如何从网页、XML文件和API中收集数据; 第8章解释了数据库的概念 (包括数据库的创建、操作和控制), 以及如何将表格转换为pandas DataFrame; 第9章将前面所学的知识应用到实际数据集中, 并对其不同方面进行研究。