python – 查找Pandas中重复列的重复位置

我知道我可以找到重复的列使用：

df.T.duplicated()

我想知道重复列是重复的索引.例如,C和D都是下面A的重复：

df = pd.DataFrame([[1,0,1,1], [2,0,2,2]], columns=['A', 'B', 'C', 'D'])

   A  B  C  D
0  1  0  1  1
1  2  0  2  2

我喜欢这样的东西：

duplicate_index = pd.Series([None, None, 'A', 'A'], ['A', 'B', 'C', 'D'])

最佳答案

我不知道重复是否有选项可以提供有关具有相同数据的第一行的信息.我的想法是使用groupby和transform,例如：

arr_first = (df.T.reset_index().groupby([col for col in df.T.columns])['index']
                .transform(lambda x: x.iloc[0]).values)

在您的示例中,arr_first等于数组([‘A’,’B’,’A’,’A’],dtype = object),因为它们的顺序与df.columns相同,以获得预期的输出,你使用np.where喜欢：

duplicate_index = pd.Series(pd.np.where(arr_first != df.columns, arr_first, None),df.columns)

和duplicate_index的结果是

A    None
B    None
C       A
D       A
dtype: object

点击查看更多相关文章

转载注明原文：python – 查找Pandas中重复列的重复位置 - 乐贴网

JAVA c c++go swift javascript Nginx UI/UE 小程序 Python C#php asp GitHub项目推荐

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

每日神器 5年前 208529

23个全网VIP影视剧解析工具（内置接口、有些支持搜索）

每日神器 5年前 5775

新版猫影视TV115解锁版：修复闪退！免登陆！无限制！一个顶17个！

每日神器 4年前 665

ZYPlayer电脑版改造：一键导入直播和点播源！流畅不卡顿~

每日神器 4年前 10612

Hbuilder打包vue项目，初始化时找不到plus对象

vue.js 5年前 48

黑枫视界TV2.0会员解锁版：免登陆！无限制！专为智能电视量身打造

每日神器 4年前 266

使dreamweaver支持ftl扩展名

前段开发 13年前 4290

4款全国各地试卷、教材下载器：支持搜索、下载，覆盖所有版本

每日神器 3年前 845

Python用PyMC3实现贝叶斯线性回归模型

人工智能 5年前 53

TVbox本地规则读取实操教程：自动读取！解放双手~

每日神器 4年前 895

2020.05.17 爱奇艺怎么下载爱奇艺最新vip账号共亨

爱奇艺 6年前 49

报名 | 美团技术沙龙第59期：聊聊美团无人车配送的实践与挑战

自动驾驶 5年前 70

Python等Slurm工作？

Python 6年前 93

如果文件名或文件路径包含非字母,非下划线字符,如何在python中导入？

Python 6年前 51

python – scipy p值返回0.0

Python 7年前 26

python – 更改多个列名称

Python 7年前 91

python – numpy中的三维数组

Python 6年前 1636

Python使用命令行pip install安装库网络速度慢解决方法

Python 5年前 57

在理解python中的Spark MLlib的LinearRegressionWithSGD示例时遇到问题吗？

Python 6年前 44

多层感知器,可视化Python中的决策边界(2D)

Python 6年前 51

Python使用sympy解决三次方程

Python 6年前 84

python-tkinter notebook.tab：文本(标题)显示不正确

Python 6年前 105

python – 在mac上安装libicu-dev

Python 6年前 94

python – networkx：创建一个由边缘引起的子图

Python 6年前 24

热门推荐

相关推荐