Pythonic | Mr Bluyee's Blog

链式比较操作

1 2	>>> False == False == True False

pythonic：

1 2	if 18 < age < 60: print("yong man")

if/else 三目运算

text = ‘男’ if gender == ‘male’ else ‘女’
在类C的语言中都支持三目运算 b?x:y
但在python能够用 if/else 清晰表达逻辑时，就没必要再额外新增一种方式来实现。

真值判断

检查某个对象是否为真值时，还显示地与 True 和 False 做比较就显得多此一举，不专业。
一般：

if attr == True:
    do_something()
if len(values) != 0: # 判断列表是否为空
    do_something()

pythonic：

if attr:
    do_something()
if values:
    do_something()

真假值对照表

for/else语句

for else 是 Python 中特有的语法格式，else 中的代码在 for 循环遍历完所有元素之后执行。
一般：

flagfound = False
for i in mylist:
    if i == theflag:
        flagfound = True
        break
    process(i)
if not flagfound:
    raise ValueError("List argument missing terminal flag.")

pythonic：

for i in mylist:
    if i == theflag:
        break
    process(i)
else:
    raise ValueError("List argument missing terminal flag.")

字符串格式化

一般：

1
2
3

s1 = "foofish.net"
s2 = "vttalk"
s3 = "welcome to %s and following %s" % (s1, s2)

pythonic：

1	s3 = "welcome to {blog} and following {wechat}".format(blog="foofish.net", wechat="vttalk")

很难说用 format 比用 %s 的代码量少，但是 format 更易于理解。

列表切片

获取列表中的部分元素最先想到的就是用 for 循环根据条件提取元素，这也是其它语言中惯用的手段，而在 Python 中还有强大的切片功能。
一般：

items = range(10)
# 奇数
odd_items = []
for i in items:
    if i % 2 != 0:
        odd_items.append(i)
# 拷贝
copy_items = []
for i in items:
    copy_items.append(i)

pythonic：

# 第1到第4个元素的范围区间
sub_items = items[1:4]
# 奇数
odd_items = items[1::2]
#拷贝
copy_items = items[::] 或者 items[:]

列表元素的下标不仅可以用正数表示，还是用负数表示，最后一个元素的位置是 -1，从右往左，依次递减。

--------------------------
 | P | y | t | h | o | n |
--------------------------
   0   1   2   3   4   5 
  -6  -5  -4  -3  -2  -1
--------------------------

善用生成器

一般：

def fib(n):
    a, b = 0, 1
    result = []
    while b < n:
        result.append(b)
        a, b = b, a+b
    return result

pythonic：

def fib(n):
    a, b = 0, 1
    while a < n:
        yield a
        a, b = b, a + b

上面是用生成器生成费波那契数列。生成器的好处就是无需一次性把所有元素加载到内存，只有迭代获取元素时才返回该元素，而列表是预先一次性把全部元素加载到了内存。此外用 yield 代码看起来更清晰。

获取字典元素

一般：

d = {'name': 'foo'}
if d.has_key('name'):
    print(d['name'])
else:
    print('unkonw')

pythonic：

1	d.get("name", "unknow")

预设字典默认值

通过 key 分组的时候，不得不每次检查 key 是否已经存在于字典中。
一般：

data = [('foo', 10), ('bar', 20), ('foo', 39), ('bar', 49)]
groups = {}
for (key, value) in data:
    if key in groups:
        groups[key].append(value)
    else:
        groups[key] = [value]

pythonic：

#　第一种方式
groups = {}
for (key, value) in data:
    groups.setdefault(key, []).append(value) 

# 第二种方式
from collections import defaultdict
groups = defaultdict(list)
for (key, value) in data:
    groups[key].append(value)

字典推导式

numbers = [1, 2, 3]
my_dict = {number: number * 2 for number in numbers}
print(my_dict)  # {1: 2, 2: 4, 3: 6}

# 还可以指定过滤条件
my_dict = {number: number * 2 for number in numbers if number > 1}
print(my_dict)  # {2: 4, 3: 6}

变量交换

一般：

>>> a = 1
>>> b = 2
>>> tmp = a
>>> a = b
>>> b = tmp

pythonic：

1	>>> a, b = b, a

带有索引位置的集合遍历

遍历集合时如果需要使用到集合的索引位置时，直接对集合迭代是没有索引信息的。
一般：

1
2
3

colors = ['red', 'green', 'blue', 'yellow']
for i in range(len(colors)):
    print i, '--->', colors[i]

pythonic：

1 2	for i, color in enumerate(colors): print i, '--->', color

字符串连接

一般：

names = ['raymond', 'rachel', 'matthew', 'roger', 'betty', 'melissa', 'judith', 'charlie']
s = names[0]
for name in names[1:]:
    s += ', ' + name
print s

pythonic：

1	print ', '.join(names)

join 是一种更加高效的字符串连接方式，使用 + 操作时，每执行一次+操作就会导致在内存中生成一个新的字符串对象，遍历8次有8个字符串生成，造成无谓的内存浪费。而用 join 方法整个过程只会产生一个字符串对象。

打开/关闭文件

一般：

f = open('data.txt')
try:
    data = f.read()
finally:
    f.close()

pythonic：

1 2	with open('data.txt') as f: data = f.read()

列表推导式

能够用一行代码简明扼要地解决问题时，绝不要用两行
一般：

1
2
3

result = []
for i in range(10):
    result.append(i)

pythonic：

1	[i for i in range(10)]

善用装饰器

装饰器可以把与业务逻辑无关的代码抽离出来，让代码保持干净清爽，而且装饰器还能被多个地方重复利用。比如一个爬虫网页的函数，如果该 URL 曾经被爬过就直接从缓存中获取，否则爬下来之后加入到缓存，防止后续重复爬取。
一般：

def web_lookup(url, saved={}):
    if url in saved:
        return saved[url]
    page = urllib.urlopen(url).read()
    saved[url] = page
    return page

pythonic：

import urllib.request as urllib

def cache(func):
    saved = {}

    def wrapper(url):
        if url in saved:
            return saved[url]
        else:
            page = func(url)
            saved[url] = page
            return page

    return wrapper

@cache
def web_lookup(url):
    return urllib.urlopen(url).read()

用装饰器写代码表面上感觉代码量更多，但是它把缓存相关的逻辑抽离出来了，可以给更多的函数调用，这样总的代码量就会少很多，而且业务方法看起来简洁了。

合理使用列表

列表对象（list）是一个查询效率高于更新操作的数据结构，比如删除一个元素和插入一个元素时执行效率就非常低，因为还要对剩下的元素进行移动。
一般：

1
2
3

names = ['raymond', 'rachel', 'matthew', 'roger', 'betty', 'melissa', 'judith', 'charlie']
names.pop(0)
names.insert(0, 'mark')

pythonic：

from collections import deque
names = deque(['raymond', 'rachel', 'matthew', 'roger', 'betty', 'melissa', 'judith', 'charlie'])
names.popleft()
names.appendleft('mark')

deque 是一个双向队列的数据结构，删除元素和插入元素会很快

序列解包

一般：

p = 'vttalk', 'female', 30, 'python@qq.com'
name = p[0]
gender = p[1]
age = p[2]
email = p[3]

pythonic：

1	name, gender, age, email = p

遍历字典的 key 和 value

方法一速度没那么快，因为每次迭代的时候还要重新进行hash查找 key 对应的 value。

1
2
3

# 方法一
for k in d:
    print k, '--->', d[k]

方法二遇到字典非常大的时候，会导致内存的消耗增加一倍以上。

1
2
3

# 方法二
for k, v in d.items():
    print k, '--->', v

pythonic：

1 2	for k, v in d.iteritems(): print k, '--->', v

iteritems 返回迭代器对象，可节省更多的内存，不过在 python3 中没有该方法了，只有 items 方法，等值于 iteritems。