链式比较操作

1
2
>>> False == False == True 
False

pythonic:

1
2
if 18 < age < 60:
print("yong man")

if/else 三目运算

text = ‘男’ if gender == ‘male’ else ‘女’
在类C的语言中都支持三目运算 b?x:y
但在python能够用 if/else 清晰表达逻辑时,就没必要再额外新增一种方式来实现。

真值判断

检查某个对象是否为真值时,还显示地与 True 和 False 做比较就显得多此一举,不专业。
一般:

1
2
3
4
if attr == True:
do_something()
if len(values) != 0: # 判断列表是否为空
do_something()

pythonic:

1
2
3
4
if attr:
do_something()
if values:
do_something()

真假值对照表

for/else语句

for else 是 Python 中特有的语法格式,else 中的代码在 for 循环遍历完所有元素之后执行。
一般:

1
2
3
4
5
6
7
8
flagfound = False
for i in mylist:
if i == theflag:
flagfound = True
break
process(i)
if not flagfound:
raise ValueError("List argument missing terminal flag.")

pythonic:

1
2
3
4
5
6
for i in mylist:
if i == theflag:
break
process(i)
else:
raise ValueError("List argument missing terminal flag.")

字符串格式化

一般:

1
2
3
s1 = "foofish.net"
s2 = "vttalk"
s3 = "welcome to %s and following %s" % (s1, s2)

pythonic:

1
s3 = "welcome to {blog} and following {wechat}".format(blog="foofish.net", wechat="vttalk")

很难说用 format 比用 %s 的代码量少,但是 format 更易于理解。

列表切片

获取列表中的部分元素最先想到的就是用 for 循环根据条件提取元素,这也是其它语言中惯用的手段,而在 Python 中还有强大的切片功能。
一般:

1
2
3
4
5
6
7
8
9
10
items = range(10)
# 奇数
odd_items = []
for i in items:
if i % 2 != 0:
odd_items.append(i)
# 拷贝
copy_items = []
for i in items:
copy_items.append(i)

pythonic:

1
2
3
4
5
6
# 第1到第4个元素的范围区间
sub_items = items[1:4]
# 奇数
odd_items = items[1::2]
#拷贝
copy_items = items[::] 或者 items[:]

列表元素的下标不仅可以用正数表示,还是用负数表示,最后一个元素的位置是 -1,从右往左,依次递减。

1
2
3
4
5
6
--------------------------
| P | y | t | h | o | n |
--------------------------
0 1 2 3 4 5
-6 -5 -4 -3 -2 -1
--------------------------

善用生成器

一般:

1
2
3
4
5
6
7
def fib(n):
a, b = 0, 1
result = []
while b < n:
result.append(b)
a, b = b, a+b
return result

pythonic:

1
2
3
4
5
def fib(n):
a, b = 0, 1
while a < n:
yield a
a, b = b, a + b

上面是用生成器生成费波那契数列。生成器的好处就是无需一次性把所有元素加载到内存,只有迭代获取元素时才返回该元素,而列表是预先一次性把全部元素加载到了内存。此外用 yield 代码看起来更清晰。

获取字典元素

一般:

1
2
3
4
5
d = {'name': 'foo'}
if d.has_key('name'):
print(d['name'])
else:
print('unkonw')

pythonic:

1
d.get("name", "unknow")

预设字典默认值

通过 key 分组的时候,不得不每次检查 key 是否已经存在于字典中。
一般:

1
2
3
4
5
6
7
data = [('foo', 10), ('bar', 20), ('foo', 39), ('bar', 49)]
groups = {}
for (key, value) in data:
if key in groups:
groups[key].append(value)
else:
groups[key] = [value]

pythonic:

1
2
3
4
5
6
7
8
9
10
# 第一种方式
groups = {}
for (key, value) in data:
groups.setdefault(key, []).append(value)

# 第二种方式
from collections import defaultdict
groups = defaultdict(list)
for (key, value) in data:
groups[key].append(value)

字典推导式

1
2
3
4
5
6
7
numbers = [1, 2, 3]
my_dict = {number: number * 2 for number in numbers}
print(my_dict) # {1: 2, 2: 4, 3: 6}

# 还可以指定过滤条件
my_dict = {number: number * 2 for number in numbers if number > 1}
print(my_dict) # {2: 4, 3: 6}

变量交换

一般:

1
2
3
4
5
>>> a = 1
>>> b = 2
>>> tmp = a
>>> a = b
>>> b = tmp

pythonic:

1
>>> a, b = b, a

带有索引位置的集合遍历

遍历集合时如果需要使用到集合的索引位置时,直接对集合迭代是没有索引信息的。
一般:

1
2
3
colors = ['red', 'green', 'blue', 'yellow']
for i in range(len(colors)):
print i, '--->', colors[i]

pythonic:

1
2
for i, color in enumerate(colors):
print i, '--->', color

字符串连接

一般:

1
2
3
4
5
names = ['raymond', 'rachel', 'matthew', 'roger', 'betty', 'melissa', 'judith', 'charlie']
s = names[0]
for name in names[1:]:
s += ', ' + name
print s

pythonic:

1
print ', '.join(names)

join 是一种更加高效的字符串连接方式,使用 + 操作时,每执行一次+操作就会导致在内存中生成一个新的字符串对象,遍历8次有8个字符串生成,造成无谓的内存浪费。而用 join 方法整个过程只会产生一个字符串对象。

打开/关闭文件

一般:

1
2
3
4
5
f = open('data.txt')
try:
data = f.read()
finally:
f.close()

pythonic:

1
2
with open('data.txt') as f:
data = f.read()

列表推导式

能够用一行代码简明扼要地解决问题时,绝不要用两行
一般:

1
2
3
result = []
for i in range(10):
result.append(i)

pythonic:

1
[i for i in range(10)]

善用装饰器

装饰器可以把与业务逻辑无关的代码抽离出来,让代码保持干净清爽,而且装饰器还能被多个地方重复利用。比如一个爬虫网页的函数,如果该 URL 曾经被爬过就直接从缓存中获取,否则爬下来之后加入到缓存,防止后续重复爬取。
一般:

1
2
3
4
5
6
def web_lookup(url, saved={}):
if url in saved:
return saved[url]
page = urllib.urlopen(url).read()
saved[url] = page
return page

pythonic:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import urllib.request as urllib

def cache(func):
saved = {}

def wrapper(url):
if url in saved:
return saved[url]
else:
page = func(url)
saved[url] = page
return page

return wrapper

@cache
def web_lookup(url):
return urllib.urlopen(url).read()

用装饰器写代码表面上感觉代码量更多,但是它把缓存相关的逻辑抽离出来了,可以给更多的函数调用,这样总的代码量就会少很多,而且业务方法看起来简洁了。

合理使用列表

列表对象(list)是一个查询效率高于更新操作的数据结构,比如删除一个元素和插入一个元素时执行效率就非常低,因为还要对剩下的元素进行移动。
一般:

1
2
3
names = ['raymond', 'rachel', 'matthew', 'roger', 'betty', 'melissa', 'judith', 'charlie']
names.pop(0)
names.insert(0, 'mark')

pythonic:

1
2
3
4
from collections import deque
names = deque(['raymond', 'rachel', 'matthew', 'roger', 'betty', 'melissa', 'judith', 'charlie'])
names.popleft()
names.appendleft('mark')

deque 是一个双向队列的数据结构,删除元素和插入元素会很快

序列解包

一般:

1
2
3
4
5
p = 'vttalk', 'female', 30, 'python@qq.com'
name = p[0]
gender = p[1]
age = p[2]
email = p[3]

pythonic:

1
name, gender, age, email = p

遍历字典的 key 和 value

方法一速度没那么快,因为每次迭代的时候还要重新进行hash查找 key 对应的 value。

1
2
3
# 方法一
for k in d:
print k, '--->', d[k]

方法二遇到字典非常大的时候,会导致内存的消耗增加一倍以上。

1
2
3
# 方法二
for k, v in d.items():
print k, '--->', v

pythonic:

1
2
for k, v in d.iteritems():
print k, '--->', v

iteritems 返回迭代器对象,可节省更多的内存,不过在 python3 中没有该方法了,只有 items 方法,等值于 iteritems。