的地方进行拆分:
print(string.split(sep=','))
Output:
['Apple', ' Banana', ' Orange', ' Blueberry']
这比之前的拆分要好,但是我们可以在一些拆分字符串之前看到空格 。可以使用 (sep=', ') 删除它:
# Notice the whitespace after the commaprint(string.split(sep=', '))
Output:
['Apple', 'Banana', 'Orange', 'Blueberry']
现在字符串被很好地分割了 。有时我们不想分割最大次数,我们可以使用 maxsplit 属性来指定我们打算拆分的次数:
print(string.split(sep=', ', maxsplit=1))print(string.split(sep=', ', maxsplit=2))
Output:
['Apple', 'Banana, Orange, Blueberry']['Apple', 'Banana', 'Orange, Blueberry']
str.splitlines(keepends=False): 有时我们想处理一个在边界处具有不同换行符('n'、nn'、'r'、'rn')的语料库 。我们要拆分成句子,而不是单个单词 。可以使用 splitline 方法来执行此操作 。当 keepends=True 时,文本中包含换行符;否则它们被排除在外
import nltk # You may have to `pip install nltk` to use this library.macbeth = nltk.corpus.gutenberg.raw('shakespeare-macbeth.txt')print(macbeth.splitlines(keepends=True)[:5])
Output:
['[The Tragedie of Macbeth by William Shakespeare 1603]n', 'n', 'n', 'Actus Primus. Scoena Prima.n', 'n']
str.strip([chars]): 我们使用 strip 方法从字符串的两侧删除尾随空格或字符 。例如:
string = " Apple Apple Apple no apple in the box apple apple "stripped_string = string.strip()print(stripped_string)left_stripped_string = ( stripped_string .lstrip('Apple') .lstrip() .lstrip('Apple') .lstrip() .lstrip('Apple') .lstrip())print(left_stripped_string)capitalized_string = left_stripped_string.capitalize()print(capitalized_string)right_stripped_string = ( capitalized_string .rstrip('apple') .rstrip() .rstrip('apple') .rstrip())print(right_stripped_string)
Output:
Apple Apple Apple no apple in the box apple appleno apple in the box apple appleNo apple in the box apple appleNo apple in the box
在上面的代码片段中,我们使用了 lstrip 和 rstrip 方法,它们分别从字符串的左侧和右侧删除尾随空格或字符 。我们还使用了 capitalize 方法,它将字符串转换为句子大小写str.zfill(width): zfill 方法用 0 前缀填充字符串以获得指定的宽度 。例如:
example = "0.8" # len(example) is 3example_zfill = example.zfill(5) # len(example_zfill) is 5print(example_zfill)
Output:
000.8
str.isalpha(): 如果字符串中的所有字符都是字母,该方法返回True;否则返回 False:
# Alphabet stringalphabet_one = "Learning"print(alphabet_one.isalpha())# Contains whitspacealphabet_two = "Learning Python"print(alphabet_two.isalpha())# Contains comma symbolsalphabet_three = "Learning,"print(alphabet_three.isalpha())
Output:
TrueFalseFalse
如果字符串字符是字母数字,str.isalnum() 返回 True;如果字符串字符是十进制,str.isdecimal() 返回 True;如果字符串字符是数字,str.isdigit() 返回 True;如果字符串字符是数字,则 str.isnumeric() 返回 True
如果字符串中的所有字符都是小写,str.islower() 返回 True;如果字符串中的所有字符都是大写,str.isupper() 返回 True;如果每个单词的首字母大写,str.istitle() 返回 True:
# islower() examplestring_one = "Artificial Neural .NETwork"print(string_one.islower())string_two = string_one.lower() # converts string to lowercaseprint(string_two.islower())# isupper() examplestring_three = string_one.upper() # converts string to uppercaseprint(string_three.isupper())# istitle() exampleprint(string_one.istitle())
推荐阅读
- Python函数科学速查表
- Django 入门:构建Python Web应用的全面指南
- Python函数详解:让代码更高效、易读、可维护
- AIGC+低代码,一场围绕开发的深度革命
- 到底该不该使用Python?
- Linux下Python安装配置指南
- Python 失宠!Hugging Face 用 Rust 新写了一个 ML 框架,现已低调开源
- Python编码的陷阱与避坑指南
- Python 3.11的10个高效新特性
- 深度NLP模型的泛化问题