别在Python中使用“+”来连接字符串了,还有更好用的方法

在我开始使用Python时,+ 就像许多编程语言(如JAVA)一样,使用加号运算符连接字符串非常直观且容易 。
但是,很快我意识到许多开发人员似乎喜欢使用该 .join() 方法而不是 +  。在本文中,我将介绍这两种方法之间的区别以及为什么不应该使用 +  。
开始

别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
 
作为初学者,或者刚从其他 + 用于连接字符串的语言切换过来的人,编写这样的代码非常容易:
str1 = "I love "str2 = "Python."print(str1 + str2)
别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
 
随着越来越多地使用Python,你可能会意识到其他人更喜欢使用这种 join() 方法:
str1 = "I love "str2 = "Python."print(''.join([str1, str2]))
别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
 
老实说,当我第一次看到上述方法时,我以为这不是直观,而是看起来很丑 。
连接多个字符串不过,有一次我需要在列表中加入多个字符串 。
strs = ['Life','is','short','I','use','Python']刚开始的时候,我是这样完成的:
strs = ['Life', 'is', 'short,', 'I', 'use', 'Python']def join_strs(strs):result = ''for s in strs:result += ' ' + sreturn result[1:]join_strs(strs)
别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
 
在这个例子中,我必须编写一个 for 循环来逐个连接字符串 。另外,结果字符串需要修剪我在开头添加的空格,因为所有字符串都需要在前面添加空格,而不是第一个 。你可能还有其他解决方案,例如将索引添加到 for 循环中,以使索引 = 0 处的字符串不应添加到该空白中 。无论如何,您仍然需要此 for 循环并为空白做一些事情 。
之后,我回想起我以前看过的 .join() 方法,也许这是我需要使用它的时候!
别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
 
是不是很简单!一行代码可以完成所有工作 。由于该 .join() 方法是由字符串对象调用的,因为该字符串对象将用于连接列表中的每个字符串,所以你无需担心开头的空白 。
但是,你认为这是我们需要使用该join()方法而不是的唯一原因 + 吗?不,请看下面的内容 。
join()方法背后的逻辑让我们比较这两种方法的性能 。我们可以使用 %timeit Jupyter Notebook 的方法对其进行评估 。
别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
 
上面显示的性能基于10万条路径,因此结果非常自信且显而易见 。使用该 join() 方法可以比使用+连接列表中的字符串快4倍 。
为什么?
这是我绘制的概念图,用于演示+用于连接字符串的方法 。
别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
使用+运算符和for循环将字符串连接到列表中
这显示了for循环和+运算符的作用:
  1. 对于每个循环,可从列表中找到字符串
  2. Python执行程序解释该表达式 result += ' ' + s并为空白申请内存地址' ' 。
  3. 然后,执行程序意识到空格需要与字符串连接,因此它将为字符串申请内存地址,s第一个循环为“ Life” 。
  4. 对于每个循环,执行程序将需要两次申请内存地址,一个用于空白,另一个用于字符串
  5. 有12次内存分配
但是,join()方法发生了什么?
别在Python中使用“+”来连接字符串了,还有更好用的方法

文章插图
使用“ join()”方法将字符串连接到列表中
  • 执行程序将计算列表中有多少个字符串?有6个;
  • 这意味着用于连接列表中字符串的字符串将需要重复 6–1= 5次;
  • 它知道总共需要11个内存空间,因此所有这些空间将立即应用并预先分配;
  • 按顺序排列字符串,返回结果 。
因此,很明显,主要区别在于内存分配的次数是性能提高的主要原因 。
想象一下,使用该 join() 方法将6个字符串连接在一起已经快了4倍 。如果我们要连接大量字符串怎么办?它将产生更大的变化!
总结在这篇简短的文章中,我比较了在Python中连接字符串时运 + 算符和 join() 方法之间的区别 。显然,join() 由于其性能,该方法是优选的 。


推荐阅读