dataframe pandas iloc loc

pandas python re模块匹配不同的sheet_name

3 You can use pandas.ExcelFile to have a peek at the sheet names, then select the sheets to keep with any method (here your regex), finally load with ......

sheet_name 模块 pandas python sheet更新时间 2023-08-04

Ceil and floor of the dataframe in Pandas Python – Round up and Truncate

In this article, we will discuss getting the ceil and floor values of the Pandas Dataframe. First, Let’s create a dataframe. Example: Python3 # import ......

and dataframe Truncate Pandas Python更新时间 2023-08-03

【pandas小技巧】--拆分列

拆分列是`pandas`中常用的一种数据操作，它可以将一个包含多个值的列按照指定的规则拆分成多个新列，方便进行后续的分析和处理。拆分列的使用场景比较广泛，以下是一些常见的应用场景： 1. 处理日期数据：在日期数据中，经常会将年、月、日等信息合并成一列，通过拆分列可以将其拆分成多个新列，方便进行时间序 ......

技巧 pandas更新时间 2023-08-03

【pandas小技巧】--反转行列顺序

反转`pandas` `DataFrame`的行列顺序是一种非常实用的操作。在实际应用中，当我们需要对数据进行排列或者排序时，通常会使用到Pandas的行列反转功能。这个过程可以帮助我们更好地理解数据集，发现其中的规律和趋势。同时，行列反转还可以帮助我们将数据可视化，使得图表更加易于理解。除了常规 ......

行列顺序技巧 pandas更新时间 2023-08-02

pandas模块------------------------筛选条件loc(多条件选择)

loc 在选择时应用条件。单条件：选择大于90成绩的学生信息： import pandas as pdsource = pd.read_excel('C:/Users/Administrator/Desktop/source.xlsx')print(source)da = source.loc[( ......

条件模块 pandas loc更新时间 2023-08-02

pandas模块--------------------------------相同（不同）文件夹下相同格式的Excel表格数据，汇总到一张表里面

上代码：import pandas as pdimport os#文件路径file_dir = r'C:/Users/Administrator/Desktop/test/'#构建新的表格名称new_filename = file_dir + '/new_file.xlsx'#找到文件路径下的所有表 ......

文件夹表格模块格式文件更新时间 2023-08-01

盘点一个Pandas中df转列表处理基础知识

大家好，我是皮皮。 ### 一、前言前几天在Python黄金群【东哥】问了一个`Pandas`基础的问题，这里拿出来给大家分享下。 ![image.png](https://upload-images.jianshu.io/upload_images/26239789-eff729351811e3 ......

基础知识基础知识 Pandas更新时间 2023-08-01

spark dataset dataframe 动态添加列

>需求利用SparkSQL计算每一行数据的数据质量，如果数据不为NULL或者不为空字符串(或者符合正则表达式)，那么该字段该行数据积一分 >网上解决方案 https://blog.csdn.net/Code_LT/article/details/87719115 https://blog.csdn ......

dataframe dataset 动态 spark更新时间 2023-07-31

【pandas小技巧】--修改列的名称

重命名 `pandas` 数据中列的名称是一种常见的数据预处理任务。这通常是因为原始数据中的列名称可能不够清晰或准确。例如，列名可能包含空格、大写字母、特殊字符或拼写错误。使用 `pandas` 的 `rename`函数可以帮助我们更改列名，从而使数据更加清晰和易于理解。此外，重命名列名还可以确保 ......

名称技巧 pandas更新时间 2023-07-31

pandas模块---------------------------------常用求平均average的用法

求平均值代码：import pandas as pd #导入模块df=pd.read_excel(r'C:\Users\Administrator/Desktop/test/1.xlsx')#文件路径a=lambda x : x.mean(1).round(2) #lambda函数m=a(df.il ......

模块常用 average pandas更新时间 2023-07-31

pandas模块---------------------求和，求平均

求和，求平均import pandas as pdstudent = pd.read_excel('C:/Users/Administrator/Desktop/1.xlsx')student = student.set_index('ID')temp = student[['Test_1','Te ......

模块 pandas更新时间 2023-07-31

【pandas小技巧】--按类型选择列

本篇介绍的是`pandas`选择列数据的一个小技巧。之前已经介绍了很多选择列数据的方式，比如`loc`，`iloc`函数，按列名称选择，按条件选择等等。这次介绍的是按照列的**数据类型**来选择列，按类型选择列可以帮助你快速选择正确的数据类型，提高数据分析的效率。 # 1. 类型种类 `panda ......

类型技巧 pandas更新时间 2023-07-30

pandas模块--------------------基础篇学习

1.读取Excel数据 Python通过pandas库可以轻松地读取Excel数据。pandas库是一个专门用于数据分析和处理的库，它可以将Excel中的数据读取为DataFrame格式，便于进行后续的数据分析和操作。 import pandas as pddata = pd.read_excel( ......

模块基础 pandas更新时间 2023-07-29

pandas模块-------------------一次读取多个excel文件并合并

合并不同excel表格的内容：代码如下： import pandas as pdimport osinputdir=r'C:\\Users\\Administrator\\Desktop\\test'df_empty=pd.DataFrame(columns=['名称','列1','列2'])fo ......

模块多个文件 pandas excel更新时间 2023-07-28

odoo pandas

fieldstr = '''id,debit,credit,balance''' self.env.cr.execute('''select %s from account_move_line order by id desc''' % fieldstr) try: a = self.env.cr. ......

pandas odoo更新时间 2023-07-28

用concat比较两个dataframe

因为equals会比对索引等，可能出现内容相同但是行序不同比对失败，可以采用concat，去除重复后如果为空则表示数据一致。 1 #比对两个DataFrame 2 3 if df1.equals(df2): 4 return True, None 5 else: 6 diff_row = pd.co ......

dataframe 两个 concat更新时间 2023-07-28

大数据量时生成DataFrame避免使用效率低的append方法

转载请注明出处：https://www.cnblogs.com/oceanicstar/p/10900332.html append方法可以很方便地拼接两个DataFrame df1.append(df2) > A B > 1 A1 B1 > 2 A2 B2 > 3 A3 B3 > 4 A4 B4 ......

DataFrame 效率方法数据 append更新时间 2023-07-27

pandas模块-----------比对不同数据（部分相同）

代码如下： import pandas as pd# 学生成绩表df_grade = pd.read_excel("find.xlsx")df_grade.head()# 学生信息表df_sinfo = pd.read_excel("data.xlsx")df_sinfo.head()# 只筛选第二 ......

模块部分数据 pandas更新时间 2023-07-27

Pandas学习笔记之常用功能

一、数值计算和统计 1.数学计算方法 # 主要数学计算方法，可用于Series和DataFrame（1） df = pd.DataFrame({'key1':np.arange(10), 'key2':np.random.rand(10)*10}) print(df) print(' ') prin ......

常用功能笔记 Pandas更新时间 2023-07-26

Pandas学习笔记之时间处理

一、Pandas时刻数据时刻数据代表时间点，是pandas的数据类型，是将值与时间点相关联的最基本类型的时间序列数据 1.pd.Timestamp date1 = datetime.datetime(2016,12,1,12,45,30) # 创建一个datetime.datetime date2 ......

时间笔记 Pandas更新时间 2023-07-26

Pandas学习笔记之Dataframe

一、Dataframe基本概念 # 二维数组"Dataframe：是一个表格型的数据结构，包含一组有序的列，其列的值类型可以是数值、字符串、布尔值等。 data = {'name': ['Jack', 'Tom', 'Mary'], 'age': [18, 19, 20], 'gender': [' ......

Dataframe 笔记 Pandas更新时间 2023-07-26

【pandas小技巧】--随机挑选子集

在 `pandas` 中，如果遇到数据量特别大的情况，随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据，从而更好地进行数据分析和决策。随机挑选子集的用途主要有： 1. 评估数据质量：随机挑选 DataFrame 的子集可以帮助我们检查数据集的质量，以便进一步探索和挖掘数据。例如，我 ......

子集技巧 pandas更新时间 2023-07-26

Pandas学习笔记之Series

一、Series基本概念及创建 1.基本概念 # Series 数据结构 # Series 是带有标签的一维数组，可以保存任何数据类型（整数，字符串，浮点数，Python对象等）,轴标签统称为索引 # 导入numpy、pandas模块 import numpy as np import pandas ......

笔记 Pandas Series更新时间 2023-07-26

使用pandas.to_html时怎么自定义表格样式

# 一、通过标签名设置`css`样式使用`pd.to_html()`方法如果不指定文件路径，该函数会返回一个格式化的`html`字符串，我们可以对这个字符串进行自定义操作，比如直接用我们设置的`css`样式加上这个格式化的`html`，就可以实现自定义表格样式，如下： ```python data ......

样式表格 to_html pandas html更新时间 2023-07-25

DataFrame随机选行+纵向拼接

#### `Dataframe`随机选行（1）`dataframe`实例： ``` city_data = {'city': ['beijing', 'shanghai', 'xining', 'dalian', 'xian', 'chongqing'], 'location': ['north' ......

纵向 DataFrame更新时间 2023-07-25

DataFrame筛选多行和多列

#### Dataframe筛选多行在实际数据筛选的时候，有时候需要选择多行，例如，有一个列表数据，需要在Dataframe里筛选，某列中在列表数据中的行。在这种情况下可以使用`isin`语法。具体如下： ``` obj_df = df[df['obj_col'].isin(obj_list)] ......

DataFrame更新时间 2023-07-25

rgi heatmap 报错AttributeError: 'DataFrame' object has no attribute 'append'

在使用rgi heatmap 时候运行时候报错： rgi heatmap -i rgi_json/ --output rgi_heatmap -cat gene_family -clus samples 报错： Traceback (most recent call last): File "/gp ......

39 AttributeError DataFrame attribute heatmap更新时间 2023-07-24

【864】pandas dataframe根据规则批量赋值

ref: Pandas新增一列并按条件赋值？把下图中的 NaN 都赋值为 0 df.loc[条件判断, 'value'] = 0 m = pd.merge(gdf_africa, df_af_mp, how='left', on='country') m.loc[m['value'].isna() ......

dataframe 规则 pandas 864更新时间 2023-07-20

pandas-2023-07-20

1、用pandas读取文件，如果是字符串类型会被当做object类型。 2、用head可以传入要输出显示的行数，但是指定行数不包括表头（并且观察到表头行不作为索引值0），另外，如果不传入参数时会默认输出表头加5行表格内容，weather.csv文件引用自以下博客https://blog.csdn.n ......

pandas 2023 07 20更新时间 2023-07-20

【pandas小技巧】--读取多个文件

日常分析数据时，只有单一数据文件的情况其实很少见，更多的情况是，我们从同一个数据来源定期或不定期的采集了很多数据文件；或者从不同的数据源采集多种不同格式的数据文件。在这样的情况下，分析数据之前，需要将不同的数据集合并起来。合并数据一般有两个维度，一是同构的数据集合并后行数增加；一是异构的数据集合并 ......

多个技巧文件 pandas更新时间 2023-07-19

共650篇 :13/22页 首页上一页10111213141516下一页尾页