导航: 起始页 > Dive Into Python > 性能优化 > 使用 timeit 模块 | << >> | ||||
Python 研究(Dive Into Python)Python 从新手到高手 [DIP_5_4_CPUG_RELEASE] |
关于 Python 代码优化你需要知道的最重要问题是,决不要自己编写计时函数。
为一个很短的代码计时都很复杂。 处理器有多少时间用于运行这个代码? 有什么在后台运行吗? 每个现代计算机都在后台运行持续或者间歇的程序。 小小的疏忽可能破坏你的百年大计,后台服务偶尔被 “唤醒” 在最后千分之一秒做一些像查收信件,连接计时通信服务器,检查应用程序更新,扫描病毒,查看是否有磁盘被插入光驱之类很有意义的事。 在开始计时测试之前,把一切都关掉,断开网络的连接。再次确定一切都关上后关掉那些不断查看网络是否恢复的服务等等。
接下来是计时框架本身引入的变化因素。 Python 解释器是否缓存了方法名的查找? 是否缓存代码块的编译结果? 正则表达式呢? 你的代码重复运行时有副作用吗? 不要忘记,你的工作结果将以比秒更小的单位呈现,你的计时框架中的小错误将会带来不可挽回的结果扭曲。
Python 社区有句俗语: “Python 自己带着电池。” 别自己写计时框架。 Python 2.3 具备一个叫做 timeit 的完美计时工具。
如果您还没有下载本书附带的例子程序, 可以 下载本程序和其他例子程序。
>>> import timeit >>> t = timeit.Timer("soundex.soundex('Pilgrim')", ... "import soundex") >>> t.timeit() 8.21683733547 >>> t.repeat(3, 2000000) [16.48319309109, 16.46128984923, 16.44203948912]
你可以在命令行使用 timeit 模块来测试一个已存在的 Python 程序,而不需要修改代码。在 http://docs.python.org/lib/node396.html 查看文档中关于命令行选项的内容。 |
注意 repeat() 返回一个时间列表。 由于 Python 计时器使用的处理器时间的微小变化(或者那些你没办法根除的可恶的后台进程),这些时间中几乎不可能出现重复。你的第一想法也许是说:“让我们求平均值获得真实的数据。”
事实上,那几乎是确定错误的。 你的代码或者 Python 解释器的变化可能缩短耗时,那些没办法去处的可恶后台进程或者其他 Python 解释器以外的因素也许另耗时延长。 如果计时结果之间的差异超过百分之几,太多的可变因素使你没法相信结果,如果不是这样则可以取最小值而丢弃其他结果。
Python 有一个方便的 min 函数可以把输入的列表返回成最小值:
>>> min(t.repeat(3, 1000000)) 8.22203948912
timeit 模块只有在你知道那段代码需要优化时使用。 如果你有一个很大的 Python 程序并且不知道你的性能问题所在,到 查看 hotshot 模块。 |
<< 性能优化 |
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | |
优化正则表达式 >> |