dataframe columns rename pandas

DataFrame选择单列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 选择单列 'A' column_A = df['A'] print(colum ......
DataFrame

DataFrame选择多列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 选择多列 'A' 和 'C' selec ......
DataFrame

查看 DataFrame 的索引

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data, index=['row1', 'row2', 'row3']) # 查看 Data ......
DataFrame 索引

DataFrame使用loc选择数据

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
DataFrame 数据 loc

DataFrame后几行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5, 6], 'B': ['a', 'b', 'c', 'd', 'e', 'f'] } df = pd.DataFrame(data) # 默认显示后5行 print(d ......
DataFrame

查看 DataFrame 的列名

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 查看 DataFrame 的列名 col ......
DataFrame

DataFrame的基本统计信息

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50] } df = pd.DataFrame(data) # 查看 DataFrame 的基本统计信息 print(d ......
DataFrame 信息

DataFrame前几行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5, 6], 'B': ['a', 'b', 'c', 'd', 'e', 'f'] } df = pd.DataFrame(data) # 默认显示前5行 print(d ......
DataFrame

Pandas库read_csv()中用于读取CSV文件的常用参数

filepath_or_buffer >CSV文件的路径或URL地址。sep >CSV文件中字段分隔符,默认为逗号。delimiter >CSV文件中字段分隔符,默认为None。header >指定哪一行作为列名,默认为0,即第一行。names >自定义列名,如果header=None,则可以使用该 ......
read_csv 常用 参数 文件 Pandas

安装python3.8 所对应的pandas 1.3.3 的版本

1、进入Anaconda prompt环境 2. 进入虚拟环境开始安装 ......
python3 版本 python pandas

pandas之filter

# 数据准备 ```python import pandas as pd product_info = { "订单号": [ "2951110000099262111", "2181910000909928191", "2194560000121355545", "11945600001213111 ......
pandas filter

【pandas小技巧】--缺失值的列

在实际应用中,数据集中经常会存在缺失值,也就是某些数据项的值并未填充或者填充不完整。缺失值的存在可能会对后续的数据分析和建模产生影响,因此需要进行处理。 `pandas`提供了多种方法来处理缺失值,例如删除缺失值、填充缺失值等。删除缺失值可能会导致数据量减少,填充缺失值则能够尽量保留原始数据集的完整 ......
缺失 技巧 pandas

4个将Pandas换为交互式表格Python包

Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可以直接在上面进行数据分析的操作。 Pivottablejs Pivottablejs是一 ......
交互式 表格 Pandas Python

Pandas实战反馈

1,df.info( ) 与 df.describe( )如果字段太多,使用df.info( )返回结果如下图,如果想查看各字段的情况,需写作df.info( verbose = True ), verbose冗长的; 2,如果想只取文件的某几列,需按如下形式,将待读取的列名放在两个中括号中,如果只 ......
实战 Pandas

Pandas 的Merge函数详解

在日常工作中,我们可能会从多个数据集中获取数据,并且希望合并两个或多个不同的数据集。这时就可以使用Pandas包中的Merge函数。在本文中,我们将介绍用于合并数据的三个函数 merge 、 merge_ordered 、 merge_asof https://avoid.overfit.cn/po ......
函数 Pandas Merge

pandas教程:第一章

列表推导式 In : [2*x for i in range(5)] Out: [0, 2, 4, 6, 8] 相当于循环的简写 这样的东西还可以循环嵌套,从而实现双重循环 完整的语法应该是: new_list = [expression for item in iterable if condit ......
教程 pandas

pandas之query

# 数据准备 ```python import pandas as pd product_info = { "订单号": ["2951110000099262111", "2181910000909928191", "2194560000121355545", "119456000012131112 ......
pandas query

pandas - pd.DataFrame()的基本操作

数据 import pandas as pd data = [ {'DEPT_NAME': '苏州市', '项目类型': '0', '已经安装': 385, '确定安装': 64, '预计安装': 422, '省份': '江苏省'}, {'DEPT_NAME': '苏州市', '项目类型': '1' ......
基本操作 DataFrame pandas pd

pandas之groupby

# 数据准备 ```python import pandas as pd df = pd.read_excel(r"C:\Users\Desktop\Excel工作表.xlsx") print(df) """ 产品 分类 价格 销量 0 桃子 水果 12 2134 1 李子 水果 23 3123 2 ......
groupby pandas

pandas python re模块匹配不同的sheet_name

3 You can use pandas.ExcelFile to have a peek at the sheet names, then select the sheets to keep with any method (here your regex), finally load with  ......
sheet_name 模块 pandas python sheet

Ceil and floor of the dataframe in Pandas Python – Round up and Truncate

In this article, we will discuss getting the ceil and floor values of the Pandas Dataframe. First, Let’s create a dataframe. Example: Python3 # import ......
and dataframe Truncate Pandas Python

linux rename的实现

linux rename可以批量重命名文件。 rename expression replacement files 可以用bash实现: 遍历文件file,用sed等替换file中的字符串,mv $file `echo $file | sed -i 's/expression/replacemen ......
rename linux

【pandas小技巧】--拆分列

拆分列是`pandas`中常用的一种数据操作,它可以将一个包含多个值的列按照指定的规则拆分成多个新列,方便进行后续的分析和处理。拆分列的使用场景比较广泛,以下是一些常见的应用场景: 1. 处理日期数据:在日期数据中,经常会将年、月、日等信息合并成一列,通过拆分列可以将其拆分成多个新列,方便进行时间序 ......
技巧 pandas

【pandas小技巧】--反转行列顺序

反转`pandas` `DataFrame`的行列顺序是一种非常实用的操作。在实际应用中,当我们需要对数据进行排列或者排序时,通常会使用到Pandas的行列反转功能。这个过程可以帮助我们更好地理解数据集,发现其中的规律和趋势。同时,行列反转还可以帮助我们将数据可视化,使得图表更加易于理解。 除了常规 ......
行列 顺序 技巧 pandas

pandas模块------------------------筛选条件loc(多条件选择)

loc 在选择时应用条件。 单条件:选择大于90成绩的学生信息: import pandas as pdsource = pd.read_excel('C:/Users/Administrator/Desktop/source.xlsx')print(source)da = source.loc[( ......
条件 模块 pandas loc

pandas模块--------------------------------相同(不同)文件夹下相同格式的Excel表格数据,汇总到一张表里面

上代码:import pandas as pdimport os#文件路径file_dir = r'C:/Users/Administrator/Desktop/test/'#构建新的表格名称new_filename = file_dir + '/new_file.xlsx'#找到文件路径下的所有表 ......
文件夹 表格 模块 格式 文件

盘点一个Pandas中df转列表处理基础知识

大家好,我是皮皮。 ### 一、前言 前几天在Python黄金群【东哥】问了一个`Pandas`基础的问题,这里拿出来给大家分享下。 ![image.png](https://upload-images.jianshu.io/upload_images/26239789-eff729351811e3 ......
基础知识 基础 知识 Pandas

spark dataset dataframe 动态添加列

>需求 利用SparkSQL计算每一行数据的数据质量,如果数据不为NULL或者不为空字符串(或者符合正则表达式),那么该字段该行数据积一分 >网上解决方案 https://blog.csdn.net/Code_LT/article/details/87719115 https://blog.csdn ......
dataframe dataset 动态 spark

【pandas小技巧】--修改列的名称

重命名 `pandas` 数据中列的名称是一种常见的数据预处理任务。这通常是因为原始数据中的列名称可能不够清晰或准确。例如,列名可能包含空格、大写字母、特殊字符或拼写错误。 使用 `pandas` 的 `rename`函数可以帮助我们更改列名,从而使数据更加清晰和易于理解。此外,重命名列名还可以确保 ......
名称 技巧 pandas

pandas模块---------------------------------常用求平均average的用法

求平均值代码:import pandas as pd #导入模块df=pd.read_excel(r'C:\Users\Administrator/Desktop/test/1.xlsx')#文件路径a=lambda x : x.mean(1).round(2) #lambda函数m=a(df.il ......
模块 常用 average pandas