练习 29:diffpatch

原文:Exercise 29: diff and patch

译者:飞龙

协议:CC BY-NC-SA 4.0

自豪地采用谷歌翻译

为了完成第四部分,你将简单把你所学习的完整的 TDD 流程,应用于你可能不熟悉的、更相关的项目。请参阅练习 28 来确认你了解该流程,并确保你严格遵循它。如果必须的话,创建一个检查列表。

警告

当你实际工作时,这个严格的流程完全没有用。目前,你正在研究该流程,并将其内在化,以便你可以在现实世界中使用它。这就是为什么我让你严格遵循它。这只是练习,所以当你做真正的工作时,不要成为一个狂热者。这本书的目的是,教你一套完成工作的策略,而不是教你一个可以传播给大众的宗教仪式。

挑战练习

diff命令接受两个文件并产生第三个文件(或输出),它包含第一个文件与第二个文件相比,修改的东西。它是git和其它版本控制工具的基础。在 Python 中实现diff是相当简单,因为有一个库可以为你做这件事,所以你不需要处理算法(这可能非常复杂)。

patch工具是diff工具的伙伴,因为它需要一个差异文件,并将其应用到另一个文件,来产生第三个文件。这可以让你选取在两个文件中的更改,运行diff来仅仅生成差异,然后将该.diff文件发送给某人。那个人可以使用他们的原始文件副本和.diff,使用patch来重建你的更改。

以下是一个工作流程示例,来演示diffpatch的工作原理。我有两个文件A.txtB.txtA.txt文件包含一些简单的文字,然后我复制它,并创建B.txt`,带有一些修改:

  1. $ diff A.txt B.txt > AB.diff
  2. $ cat AB.diff
  3. 2,4c2,4
  4. < her fleece was white a mud
  5. < and every where that marry
  6. < her lamb would chew cud
  7. ---
  8. > her fleece was white a snow
  9. > and every where that marry went
  10. > her lamb was sure to go

这产生了文件AB.diff,它拥有A.txtB.txt相比的变化,你可以看到这是在修复我打破的押韵。一旦你有了AB.diff,你可以使用补丁应用更改:

  1. $ patch A.txt AB.diff
  2. $ diff A.txt B.txt

最后的命令应该不显示认识输出,因为之前的patch命令使A.txtB.txt具有相同的内容。

这两个东西的实现,应该从diff命令开始,因为使用 Python 来作弊,你有完全实现的diff。你可以在difflib文档的末尾找到它,但尝试实现你的版本,并看看与之相比怎么样。

这个练习的真正要点就是patch工具,Python 没有为你实现它。你将要阅读difflib中的SequenceMatcher类,并特别查看SequenceMatch.get_opcodes函数。这是你patch工作的唯一线索,但这是一个非常好的线索。

研究性学习

你能把这种diffpatch的组合做到什么程度?你可以将它们组合成一个工具吗?你可以让他们像微型的git那样工作吗?

深入学习

找到尽可能多的差异比较算法。另一件需要研究的事情是git的工作方式。