TypechoJoeTheme

至尊技术网

统计
登录
用户名
密码
搜索到 2 篇与 的结果
2025-07-19

Python如何检测异常数据——Z-score/IQR算法详解

Python如何检测异常数据——Z-score/IQR算法详解
一、为什么需要异常检测?在数据分析的实际场景中,约5%-15%的数据可能存在异常值。这些"离群点"可能由传感器故障、人为录入错误或特殊事件导致,若不处理会影响模型训练和统计结论。例如: - 电商订单中出现金额为99999的测试数据 - 体温数据集中混入摄氏/华氏混合记录 - 工业设备传感器突发异常波动二、Z-score算法原理与实现2.1 数学基础Z-score(标准分数)通过计算数据点与均值的标准差距离来量化异常程度:[ Z = \frac{X - \mu}{\sigma} ]其中μ为均值,σ为标准差。通常当|Z|>3时,判定为异常值(99.7%的正态分布数据落在μ±3σ内)。2.2 Python实现python import numpy as np from scipy import statsdef detectoutlierszscore(data, threshold=3): zscores = np.abs(stats.zscore(data)) return np.where(zscores > threshold)示例数据data ...
2025年07月19日
380 阅读
0 评论
2025-07-18

Python处理学生成绩:从原始数据到统计分析的完整指南,python学生成绩统计问题

Python处理学生成绩:从原始数据到统计分析的完整指南,python学生成绩统计问题
一、为什么选择Python处理成绩数据?在教务管理工作中,我每月需要手工处理300+学生的五次周测、两次月考成绩。直到发现同事用Excel公式崩溃的深夜,才意识到该升级工具链了。Python的Pandas库在数据批处理上的优势,让原本需要3小时的工作缩短到10分钟——这正是技术存在的意义。二、实战准备:原始数据规范化典型的原始成绩表往往存在以下问题:python import pandas as pd rawdata = pd.readexcel('杂乱成绩单.xlsx') print(raw_data.head(2))常见问题清单:1. 合并单元格(如"高一(3)班"跨多行)2. 缺失值(缺考显示为"请假")3. 异常值(某学生数学成绩记录为"优秀")数据清洗四步法: 1. 统一编码格式 python data = raw_data.convert_dtypes() # 自动识别类型 2. 处理缺失值 python data.fillna(0, inplace=True) # 缺考按0分处理 data.replace('请假', 0, inplace=True) 3. 转换...
2025年07月18日
246 阅读
0 评论
25,267 文章数
92 评论量

人生倒计时

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月