人生苦短，为什么我要用Python？

时间：2018-08-05 18:16 来源：阅读次数：复制分享我要评论

随着机器学习的兴起，Python 逐步成为了「最受欢迎」的语言。它简单易用、逻辑明确并拥有海量的扩展包，因此其不仅成为机器学习与数据科学的首选语言，同时在网页、数据爬取可科学研究等方面成为不二选择。此外，很多入门级的机器学习开发者都是跟随大流选择 Python，但到底为什么要选择 Python 就是本文的核心内容。

本教程的目的是让你相信两件事：首先，Python 是一种非常棒的编程语言；其次，如果你是一名科学家，Python 很可能值得你去学习。本教程并非想要说明 Python 是一种万能的语言；相反，作者明确讨论了在几种情况下，Python 并不是一种明智的选择。本教程的目的只是提供对 Python 一些核心特征的评论，并阐述作为一种通用的科学计算语言，它比其他常用的替代方案（最著名的是 R 和 Matlab）更有优势。

本教程的其余部分假定你已经有了一些编程经验，如果你非常精通其他以数据为中心的语言（如 R 或 Matlab），理解本教程就会非常容易。本教程不能算作一份关于 Python 的介绍，且文章重点在于为什么应该学习 Python 而不是怎样写 Python 代码（尽管其他地方有大量的优秀教程）。

概述

Python 是一种广泛使用、易于学习、高级、通用的动态编程语言。这很令人满意，所以接下来分开讨论一些特征。

Python（相对来说）易于学习

编程很难，因此从绝对意义上来说，除非你已经拥有编程经验，否则编程语言难以学习。但是，相对而言，Python 的高级属性（见下一节）、语法可读性和语义直白性使得它比其他语言更容易学习。例如，这是一个简单 Python 函数的定义（故意未注释），它将一串英语单词转换为（crummy）Pig Latin：

defpig_latin(text):
'''Takesinasequenceofwordsandconvertsitto(imperfect)piglatin.'''

word_list=text.split('')
output_list=[]

forwordinword_list:

word=word.lower()

ifword.isalpha():
first_char=word[0]

iffirst_charin'aeiou':
word=word+'ay'
else:
word=word[1:]+first_char+'yay'

output_list.append(word)

pygged=''.join(output_list)
returnpygged

以上函数事实上无法生成完全有效的 Pig Latin（假设存在「有效 Pig Latin」），但这没有关系。有些情况下它是可行的：

test1=pig_latin("letusseeifthisworks")

print(test1)

抛开 Pig Latin 不说，这里的重点只是，出于几个原因，代码是很容易阅读的。首先，代码是在高级抽象中编写的（下面将详细介绍），因此每行代码都会映射到一个相当直观的操作。这些操作可以是「取这个单词的第一个字符」，而不是映射到一个没那么直观的低级操作，例如「为一个字符预留一个字节的内存，稍后我会传入一个字符」。其次，控制结构（如，for—loops，if—then 条件等）使用诸如「in」，「and」和「not」的简单单词，其语义相对接近其自然英语含义。第三，Python 对缩进的严格控制强加了一种使代码可读的规范，同时防止了某些常见的错误。第四，Python 社区非常强调遵循样式规定和编写「Python 式的」代码，这意味着相比使用其他语言的程序员而言，Python 程序员更倾向于使用一致的命名规定、行的长度、编程习惯和其他许多类似特征，它们共同使别人的代码更易阅读（尽管这可以说是社区的一个特征而不是语言本身）。

Python 是一种高级语言

与其他许多语言相比，Python 是一种相对「高级」的语言：它不需要（并且在许多情况下，不允许）用户担心太多底层细节，而这是其他许多语言需要去处理的。例如，假设我们想创建一个名为「my_box_of_things」的变量当作我们所用东西的容器。我们事先不知道我们想在盒子中保留多少对象，同时我们希望在添加或删除对象时，对象数量可以自动增减。所以这个盒子需要占据一个可变的空间：在某个时间点，它可能包含 8 个对象（或「元素」），而在另一个时间点，它可能包含 257 个对象。在像 C 这样的底层语言中，这个简单的要求就已经给我们的程序带来了一些复杂性，因为我们需要提前声明盒子需要占据多少空间，然后每次我们想要增加盒子需要的空间时，我么需要明确创建一个占据更多空间的全新的盒子，然后将所有东西拷贝到其中。

相比之下，在 Python 中，尽管在底层这些过程或多或少会发生（效率较低），但我们在使用高级语言编写时并不需要担心这一部分。从我们的角度来看，我们可以创建自己的盒子并根据喜好添加或删除对象：

#Createabox(really,a'list')with5things#Create
my_box_of_things=['Davenport','kettledrum','swallow-tailcoat','tablecloth','patentleathershoes']

print(my_box_of_things)
['Davenport','kettledrum','swallow-tailcoat','tablecloth','patentleathershoes']
#Addafewmorethings
my_box_of_things+=['bathingsuit','bowlingball','clarinet','ring']

#Maybeaddonelastthing
my_box_of_things.append('radiothatonlyneedsafuse')

#Let'sseewhatwehave...
print(my_box_of_things)

更一般来说，Python（以及根据定义的其他所有高级语言）倾向于隐藏需要在底层语言中明确表达的各种死记硬背的声明。这使得我们可以编写非常紧凑、清晰的代码（尽管它通常以降低性能为代价，因为内部不再可访问，因此优化变得更加困难）。

例如，考虑从文件中读取纯文本这样看似简单的行为。对于与文件系统直接接触而伤痕累累的开发者来说，从概念上看似乎只需要两个简单的操作就可以完成：首先打开一个文件，然后从其中读取。实际过程远不止这些，并且比 Python 更底层的语言通常强制（或至少是鼓励）我们去承认这一点。例如，这是在 Java 中从文件中读取内容的规范（尽管肯定不是最简洁的）方法：

importjava.io.BufferedReader;
importjava.io.FileReader;
importjava.io.IOException;

publicclassReadFile{
publicstaticvoidmain(String[]args)throwsIOException{
StringfileContents=readEntireFile("./foo.txt");
}

privatestaticStringreadEntireFile(Stringfilename)throwsIOException{
FileReaderin=newFileReader(filename);
StringBuildercontents=newStringBuilder();
char[]buffer=newchar[4096];
intread=0;
do{
contents.append(buffer,0,read);
read=in.read(buffer);
}while(read>=0);
returncontents.toString();
}
}

上一篇：的哥沿途大谈"性事"言语露骨女乘客尴尬取证投诉

下一篇：5岁女童患白血病白血病是怎么引起的