TypechoJoeTheme

至尊技术网

统计
登录
用户名
密码
搜索到 2 篇与 的结果
2025-12-22

Python数据变形实战:用melt实现宽表转长表的三大场景

Python数据变形实战:用melt实现宽表转长表的三大场景
正文:在数据分析中,我们常遇到这样的困境:业务系统导出的Excel表格列宽到需要横向滚动十几次,而统计工具却要求"一维化"的数据格式。这时就需要将宽表(Wide Format)转为长表(Long Format),而Pandas的melt函数正是解决这个问题的瑞士军刀。场景一:电商订单属性展开假设有一张包含用户ID和多个订单属性的宽表:import pandas as pd wide_df = pd.DataFrame({ 'user_id': [101, 102], 'order_2023Q1': [2, 1], 'order_2023Q2': [3, 0], 'avg_amount': [150, 200] }) 要将季度订单列转为"时间段-订单数"的长格式,只需:long_df = pd.melt( wide_df, id_vars=['user_id', 'avg_amount'], # 保留的固定列 value_vars=['order_2023Q1', 'order_2023Q2'], # 要转换的列 ...
2025年12月22日
36 阅读
0 评论
2025-12-20

Pandas分组数据中跨行计算差异的3个实战技巧

Pandas分组数据中跨行计算差异的3个实战技巧
正文:在数据分析工作中,我们常遇到这样的需求:需要按部门计算销售额环比增长,或按用户分组统计连续登录天数差值。这类分组跨行计算场景,传统的循环处理效率低下,而Pandas的向量化操作能优雅解决。下面通过三个典型案例,拆解实用技巧。一、时间序列下的组内差值计算处理带有时间戳的日志数据时,常需计算同组相邻记录的时间差。例如电商用户两次访问间隔: # 构造测试数据 import pandas as pd df = pd.DataFrame({ 'user_id': [1,1,2,2,2], 'visit_time': ['2023-01-01 09:00', '2023-01-03 11:00', '2023-01-02 14:00', '2023-01-02 18:00', '2023-01-05 10:00'] }) df['visit_time'] = pd.to_datetime(df['visit_time']) # 按用户分组计算时间差 df['time_diff'] = df.groupby('user_id')[...
2025年12月20日
34 阅读
0 评论

人生倒计时

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月

最新回复

  1. 强强强
    2025-04-07
  2. jesse
    2025-01-16
  3. sowxkkxwwk
    2024-11-20
  4. zpzscldkea
    2024-11-20
  5. bruvoaaiju
    2024-11-14

标签云