dataframe pandas iloc loc

DataFrame 计数value_counts 后转成df

import pandas as pd # 创建示例 DataFrame data = {'Category': ['A', 'B', 'A', 'C', 'A', 'B', 'C', 'A', 'B']} df = pd.DataFrame(data) # 使用 value_counts() 方法 ......
value_counts DataFrame counts value

DataFrame拆分某列生成新列

import pandas as pd # 创建示例 DataFrame data = {'Name': ['Alice,25', 'Bob,30', 'Charlie,35']} df = pd.DataFrame(data) # 使用 str.split() 方法拆分 'Name' 列的数据 d ......
DataFrame

DataFrame 拼接几列生成新列

import pandas as pd # 创建示例 DataFrame data = {'First Name': ['Alice', 'Bob', 'Charlie'], 'Last Name': ['Smith', 'Johnson', 'Brown'], 'Age': [25, 30, 35 ......
DataFrame

DataFrame根据某列的值取另一列的值

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['apple', 'banana', 'orange', 'apple', 'banana'] } df = pd.DataFrame(data) # ......
DataFrame

DataFrame删除某列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 使用 drop() 方法删除列 'B' ......
DataFrame

DataFrame 删除某行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 使用 drop() 方法删除索引为 1 ......
DataFrame

DataFrame 对某列求和、平均值、计数、最大值、最小值

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50] } df = pd.DataFrame(data) # 对列 'B' 求和 column_sum = df['B ......
最大值 平均值 DataFrame

DataFrame 新增新列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 增加新列 'C' new_data = [10, 20, 30] df['C' ......
DataFrame

DataFrame修改某列的值

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 修改列 'A' 的值 new_values = [10, 20, 30] df ......
DataFrame

DataFrame使用iloc选择数据

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
DataFrame 数据 iloc

DataFrame 使用条件索引选择满足条件的行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
条件 DataFrame 索引

DataFrame使用loc选择数据

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
DataFrame 数据 loc

DataFrame选择单列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 选择单列 'A' column_A = df['A'] print(colum ......
DataFrame

DataFrame选择多列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 选择多列 'A' 和 'C' selec ......
DataFrame

查看 DataFrame 的索引

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data, index=['row1', 'row2', 'row3']) # 查看 Data ......
DataFrame 索引

DataFrame后几行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5, 6], 'B': ['a', 'b', 'c', 'd', 'e', 'f'] } df = pd.DataFrame(data) # 默认显示后5行 print(d ......
DataFrame

查看 DataFrame 的列名

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 查看 DataFrame 的列名 col ......
DataFrame

DataFrame的基本统计信息

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50] } df = pd.DataFrame(data) # 查看 DataFrame 的基本统计信息 print(d ......
DataFrame 信息

DataFrame前几行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5, 6], 'B': ['a', 'b', 'c', 'd', 'e', 'f'] } df = pd.DataFrame(data) # 默认显示前5行 print(d ......
DataFrame

Pandas库read_csv()中用于读取CSV文件的常用参数

filepath_or_buffer >CSV文件的路径或URL地址。sep >CSV文件中字段分隔符,默认为逗号。delimiter >CSV文件中字段分隔符,默认为None。header >指定哪一行作为列名,默认为0,即第一行。names >自定义列名,如果header=None,则可以使用该 ......
read_csv 常用 参数 文件 Pandas

安装python3.8 所对应的pandas 1.3.3 的版本

1、进入Anaconda prompt环境 2. 进入虚拟环境开始安装 ......
python3 版本 python pandas

pandas之filter

# 数据准备 ```python import pandas as pd product_info = { "订单号": [ "2951110000099262111", "2181910000909928191", "2194560000121355545", "11945600001213111 ......
pandas filter

【pandas小技巧】--缺失值的列

在实际应用中,数据集中经常会存在缺失值,也就是某些数据项的值并未填充或者填充不完整。缺失值的存在可能会对后续的数据分析和建模产生影响,因此需要进行处理。 `pandas`提供了多种方法来处理缺失值,例如删除缺失值、填充缺失值等。删除缺失值可能会导致数据量减少,填充缺失值则能够尽量保留原始数据集的完整 ......
缺失 技巧 pandas

4个将Pandas换为交互式表格Python包

Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可以直接在上面进行数据分析的操作。 Pivottablejs Pivottablejs是一 ......
交互式 表格 Pandas Python

Pandas实战反馈

1,df.info( ) 与 df.describe( )如果字段太多,使用df.info( )返回结果如下图,如果想查看各字段的情况,需写作df.info( verbose = True ), verbose冗长的; 2,如果想只取文件的某几列,需按如下形式,将待读取的列名放在两个中括号中,如果只 ......
实战 Pandas

Pandas 的Merge函数详解

在日常工作中,我们可能会从多个数据集中获取数据,并且希望合并两个或多个不同的数据集。这时就可以使用Pandas包中的Merge函数。在本文中,我们将介绍用于合并数据的三个函数 merge 、 merge_ordered 、 merge_asof https://avoid.overfit.cn/po ......
函数 Pandas Merge

pandas教程:第一章

列表推导式 In : [2*x for i in range(5)] Out: [0, 2, 4, 6, 8] 相当于循环的简写 这样的东西还可以循环嵌套,从而实现双重循环 完整的语法应该是: new_list = [expression for item in iterable if condit ......
教程 pandas

pandas之query

# 数据准备 ```python import pandas as pd product_info = { "订单号": ["2951110000099262111", "2181910000909928191", "2194560000121355545", "119456000012131112 ......
pandas query

pandas - pd.DataFrame()的基本操作

数据 import pandas as pd data = [ {'DEPT_NAME': '苏州市', '项目类型': '0', '已经安装': 385, '确定安装': 64, '预计安装': 422, '省份': '江苏省'}, {'DEPT_NAME': '苏州市', '项目类型': '1' ......
基本操作 DataFrame pandas pd

pandas之groupby

# 数据准备 ```python import pandas as pd df = pd.read_excel(r"C:\Users\Desktop\Excel工作表.xlsx") print(df) """ 产品 分类 价格 销量 0 桃子 水果 12 2134 1 李子 水果 23 3123 2 ......
groupby pandas