dataframe pandas iloc loc
DataFrame 计数value_counts 后转成df
import pandas as pd # 创建示例 DataFrame data = {'Category': ['A', 'B', 'A', 'C', 'A', 'B', 'C', 'A', 'B']} df = pd.DataFrame(data) # 使用 value_counts() 方法 ......
DataFrame拆分某列生成新列
import pandas as pd # 创建示例 DataFrame data = {'Name': ['Alice,25', 'Bob,30', 'Charlie,35']} df = pd.DataFrame(data) # 使用 str.split() 方法拆分 'Name' 列的数据 d ......
DataFrame 拼接几列生成新列
import pandas as pd # 创建示例 DataFrame data = {'First Name': ['Alice', 'Bob', 'Charlie'], 'Last Name': ['Smith', 'Johnson', 'Brown'], 'Age': [25, 30, 35 ......
DataFrame根据某列的值取另一列的值
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['apple', 'banana', 'orange', 'apple', 'banana'] } df = pd.DataFrame(data) # ......
DataFrame删除某列
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 使用 drop() 方法删除列 'B' ......
DataFrame 删除某行
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 使用 drop() 方法删除索引为 1 ......
DataFrame 对某列求和、平均值、计数、最大值、最小值
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50] } df = pd.DataFrame(data) # 对列 'B' 求和 column_sum = df['B ......
DataFrame 新增新列
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 增加新列 'C' new_data = [10, 20, 30] df['C' ......
DataFrame修改某列的值
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 修改列 'A' 的值 new_values = [10, 20, 30] df ......
DataFrame使用iloc选择数据
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
DataFrame 使用条件索引选择满足条件的行
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
DataFrame使用loc选择数据
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
DataFrame选择单列
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 选择单列 'A' column_A = df['A'] print(colum ......
DataFrame选择多列
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 选择多列 'A' 和 'C' selec ......
查看 DataFrame 的索引
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data, index=['row1', 'row2', 'row3']) # 查看 Data ......
DataFrame后几行
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5, 6], 'B': ['a', 'b', 'c', 'd', 'e', 'f'] } df = pd.DataFrame(data) # 默认显示后5行 print(d ......
查看 DataFrame 的列名
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 查看 DataFrame 的列名 col ......
DataFrame的基本统计信息
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50] } df = pd.DataFrame(data) # 查看 DataFrame 的基本统计信息 print(d ......
DataFrame前几行
import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5, 6], 'B': ['a', 'b', 'c', 'd', 'e', 'f'] } df = pd.DataFrame(data) # 默认显示前5行 print(d ......
Pandas库read_csv()中用于读取CSV文件的常用参数
filepath_or_buffer >CSV文件的路径或URL地址。sep >CSV文件中字段分隔符,默认为逗号。delimiter >CSV文件中字段分隔符,默认为None。header >指定哪一行作为列名,默认为0,即第一行。names >自定义列名,如果header=None,则可以使用该 ......
pandas之filter
# 数据准备 ```python import pandas as pd product_info = { "订单号": [ "2951110000099262111", "2181910000909928191", "2194560000121355545", "11945600001213111 ......
【pandas小技巧】--缺失值的列
在实际应用中,数据集中经常会存在缺失值,也就是某些数据项的值并未填充或者填充不完整。缺失值的存在可能会对后续的数据分析和建模产生影响,因此需要进行处理。 `pandas`提供了多种方法来处理缺失值,例如删除缺失值、填充缺失值等。删除缺失值可能会导致数据量减少,填充缺失值则能够尽量保留原始数据集的完整 ......
4个将Pandas换为交互式表格Python包
Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可以直接在上面进行数据分析的操作。 Pivottablejs Pivottablejs是一 ......
Pandas实战反馈
1,df.info( ) 与 df.describe( )如果字段太多,使用df.info( )返回结果如下图,如果想查看各字段的情况,需写作df.info( verbose = True ), verbose冗长的; 2,如果想只取文件的某几列,需按如下形式,将待读取的列名放在两个中括号中,如果只 ......
Pandas 的Merge函数详解
在日常工作中,我们可能会从多个数据集中获取数据,并且希望合并两个或多个不同的数据集。这时就可以使用Pandas包中的Merge函数。在本文中,我们将介绍用于合并数据的三个函数 merge 、 merge_ordered 、 merge_asof https://avoid.overfit.cn/po ......
pandas教程:第一章
列表推导式 In : [2*x for i in range(5)] Out: [0, 2, 4, 6, 8] 相当于循环的简写 这样的东西还可以循环嵌套,从而实现双重循环 完整的语法应该是: new_list = [expression for item in iterable if condit ......
pandas之query
# 数据准备 ```python import pandas as pd product_info = { "订单号": ["2951110000099262111", "2181910000909928191", "2194560000121355545", "119456000012131112 ......
pandas - pd.DataFrame()的基本操作
数据 import pandas as pd data = [ {'DEPT_NAME': '苏州市', '项目类型': '0', '已经安装': 385, '确定安装': 64, '预计安装': 422, '省份': '江苏省'}, {'DEPT_NAME': '苏州市', '项目类型': '1' ......
pandas之groupby
# 数据准备 ```python import pandas as pd df = pd.read_excel(r"C:\Users\Desktop\Excel工作表.xlsx") print(df) """ 产品 分类 价格 销量 0 桃子 水果 12 2134 1 李子 水果 23 3123 2 ......