Pandas教程( 四 )

b) 重命名某些列(在下面的示例中 , 将“PassengerId”改为“id”) 。
data.rename(columns = {data.columns[0]:'id'}, inplace=True)等同于
data.rename(columns = {'PassengerId':'id'}, inplace=True)Index(['id', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')c) 重命名多个列(“PassengerId”、“Pclass”和“SibSp”) 。
data.rename(columns = {'PassengerId':'Passenger_Id', 'Pclass':'P_Class', 'SibSp':'Sib_Sp'}, inplace=True)Index(['Passenger_Id', 'Survived', 'P_Class', 'Name', 'Sex', 'Age', 'Sib_Sp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')d) 通过列表生成式将下划线替换为点(仅适用于“Passenger.Id”、“P.Class”和“Sib.Sp”) 。
data.columns = [x.lower().replace('.', '') for x in data.columns]Index(['passengerid', 'survived', 'pclass', 'name', 'sex', 'age', 'sibsp', 'parch', 'ticket', 'fare', 'cabin', 'embarked'], dtype='object')e) 小写化字符并删除点(应用于'Passenger.Id' , 'P.Class'和'Sib.Sp') 。
data.columns = [x.lower().replace('.', '') for x in data.columns]Index(['passengerid', 'survived', 'pclass', 'name', 'sex', 'age', 'sibsp', 'parch', 'ticket', 'fare', 'cabin', 'embarked'], dtype='object')f) 将列名称大写 。
data.columns = [x.capitalize() for x in data.columns]Index(['Passengerid', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'Sibsp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')布尔索引:locdata.loc[, ] , 按列名称选择
a) 选择行 。
data.loc[[3]]
Pandas教程文章插图
b) 选择行数组 。
data.loc[6:8]
Pandas教程文章插图
c) 选择几行 。
data.loc[[7,28,39]]
Pandas教程文章插图
d) 从“Name”、“Age”、“Sex”和“Survived”几个列中选择一行 。
data.loc[[7], ['Name', 'Age', 'Sex', 'Survived']]
Pandas教程文章插图
e) 从多个列中选择多行 。
data.loc[[7,28,39], ['Name', 'Age', 'Sex','Survived']]
Pandas教程文章插图
f) 在某些条件下使用loc选择特定值 。 在这种情况下 , 从第4行到第10行选择年龄大于或等于10岁的乘客 。
data.loc[4:10, ['Age']] >= 10
Pandas教程文章插图
g) 在某些条件下使用loc选择特定值 。 在这种情况下 , 从前5行选择乘坐C123客舱的乘客 。
data.loc[:4, ['Cabin']] == 'C123'
Pandas教程文章插图


推荐阅读