# 选择指定的列 df['column_name'] # 通过标签选择数据 df.loc[row_index, column_name] # 通过位置选择数据 df.iloc[row_index, column_index] # 通过标签或位置选择数据 df.ix[row_index, column_name] # 选择指定的列 df.filter(items=['column_name1', 'column_name2']) # 选择列名匹配正则表达式的列 df.filter(regex='regex') # 随机选择 n 行数据 df.sample(n=5)
# 按照指定列的值排序 df.sort_values('column_name') # 按照多个列的值排序 df.sort_values(['column_name1', 'column_name2'], ascending=[True, False]) # 按照索引排序 df.sort_index()