- 编程风格:程序设计与系统构建的艺术(原书第2版)
- (美)克里斯蒂娜·维代拉·洛佩斯
- 380字
- 2025-04-15 17:59:02
Prologue
导言
词频
就像Queneau的故事一样,本书中的计算任务很简单:给定一个文本文件,我们希望显示N(例如25)个出现频率最高的单词,以及它们对应的出现频率,并且按词频降序排列。我们应确保对单词的大小写进行规范并忽略诸如“the”“for”等停用词。为了简单起见,我们不关心词频相同的单词的顺序。这个计算任务被称为词频分析任务。
以下是一个词频程序接收的输入文件,以及程序运行后产生的相应输出的示例:
输入:

输出:

如果对Gutenberg Collection[1]上提供的简·奥斯汀的《傲慢与偏见》[2]运行这个词频程序,我们将得到以下输出:


本书的所有示例程序都(分别)实现了这个词频分析任务。此外,每章都有一组练习,其中一个练习是使用相应的风格实现另一个简单的计算任务。下面我给出了一些建议。
练习中的这些计算任务足够简单,任何高年级学生都可以轻松解决。读者们不应该把解决算法上的困难作为关注点,相反,应该把关注点放在遵循每种风格的约束上。