Python 字符串深度总结( 三 )

 的地方进行拆分:
print(string.split(sep=','))Output:
['Apple', ' Banana', ' Orange', ' Blueberry']这比之前的拆分要好,但是我们可以在一些拆分字符串之前看到空格 。可以使用 (sep=', ') 删除它:
# Notice the whitespace after the commaprint(string.split(sep=', '))Output:
['Apple', 'Banana', 'Orange', 'Blueberry']现在字符串被很好地分割了 。有时我们不想分割最大次数,我们可以使用 maxsplit 属性来指定我们打算拆分的次数:
print(string.split(sep=', ', maxsplit=1))print(string.split(sep=', ', maxsplit=2))Output:
['Apple', 'Banana, Orange, Blueberry']['Apple', 'Banana', 'Orange, Blueberry']str.splitlines(keepends=False): 有时我们想处理一个在边界处具有不同换行符('n'、nn'、'r'、'rn')的语料库 。我们要拆分成句子,而不是单个单词 。可以使用 splitline 方法来执行此操作 。当 keepends=True 时,文本中包含换行符;否则它们被排除在外
import nltk  # You may have to `pip install nltk` to use this library.macbeth = nltk.corpus.gutenberg.raw('shakespeare-macbeth.txt')print(macbeth.splitlines(keepends=True)[:5])Output:
['[The Tragedie of Macbeth by William Shakespeare 1603]n', 'n', 'n', 'Actus Primus. Scoena Prima.n', 'n']str.strip([chars]): 我们使用 strip 方法从字符串的两侧删除尾随空格或字符 。例如:
string = "    Apple Apple Apple no apple in the box apple apple             "stripped_string = string.strip()print(stripped_string)left_stripped_string = (    stripped_string    .lstrip('Apple')    .lstrip()    .lstrip('Apple')    .lstrip()    .lstrip('Apple')    .lstrip())print(left_stripped_string)capitalized_string = left_stripped_string.capitalize()print(capitalized_string)right_stripped_string = (    capitalized_string    .rstrip('apple')    .rstrip()    .rstrip('apple')    .rstrip())print(right_stripped_string)Output:
Apple Apple Apple no apple in the box apple appleno apple in the box apple appleNo apple in the box apple appleNo apple in the box在上面的代码片段中,我们使用了 lstrip 和 rstrip 方法,它们分别从字符串的左侧和右侧删除尾随空格或字符 。我们还使用了 capitalize 方法,它将字符串转换为句子大小写str.zfill(width): zfill 方法用 0 前缀填充字符串以获得指定的宽度 。例如:
example = "0.8"  # len(example) is 3example_zfill = example.zfill(5) # len(example_zfill) is 5print(example_zfill)Output:
000.8str.isalpha(): 如果字符串中的所有字符都是字母,该方法返回True;否则返回 False:
# Alphabet stringalphabet_one = "Learning"print(alphabet_one.isalpha())# Contains whitspacealphabet_two = "Learning Python"print(alphabet_two.isalpha())# Contains comma symbolsalphabet_three = "Learning,"print(alphabet_three.isalpha())Output:
TrueFalseFalse如果字符串字符是字母数字,str.isalnum() 返回 True;如果字符串字符是十进制,str.isdecimal() 返回 True;如果字符串字符是数字,str.isdigit() 返回 True;如果字符串字符是数字,则 str.isnumeric() 返回 True
如果字符串中的所有字符都是小写,str.islower() 返回 True;如果字符串中的所有字符都是大写,str.isupper() 返回 True;如果每个单词的首字母大写,str.istitle() 返回 True:
# islower() examplestring_one = "Artificial Neural .NETwork"print(string_one.islower())string_two = string_one.lower()  # converts string to lowercaseprint(string_two.islower())# isupper() examplestring_three = string_one.upper() # converts string to uppercaseprint(string_three.isupper())# istitle() exampleprint(string_one.istitle())


推荐阅读