Video description
课程简介
在用Python进行Pandas数据清洗和建模的视频课程中,Daniel Y. Chen为《用Python基础语句进行Pandas数据分析视频课》构建了基础。在这一系列课程中,Dan教给你清理和处理数据所必需的技术和技巧。Dan向你展示如何使用某些内置的Python库对数据进行再加工,以清理加载到Pandas中的数据。一旦完成数据清理,你将会想要对它进行分析,所以Dan接下来会向你介绍用于模型拟合的其它库。
Get技能
• 使用Pandas的数据类型
• 对数据类型进行转换
• 使用字符串方法和正则表达式
• 使用函数
• 聚合、转换和筛选数据
• 使用Pandas和Python的日期时间方法
• 数据建模
Table of Contents
概述
用Python进行Pandas数据清理和建模:概述
第1课 Pandas数据类型
学习目标
1.1 理解Pandas中的数据类型
1.2 数据类型转换
1.3 分类数据的转换和操作
第2课: Pandas中的非结构化文本和字符串
学习目标
2.1 理解字符串
2.2 使用字符串方法
2.3 使用更多的字符串方法
2.4 利用字符串格式
2.5 利用正则表达式(regex)
2.6 访问正则表达式库
第3课: 使用函数
学习目标
3.1 使用函数
3.2 apply应用的基础知识
3.3 逐行和逐列使用apply
3.4 使用向量化函数
3.5 使用lambda函数
第4课:使用groupby进行拆分计算:拆分-应用-合并
学习目标
4.1 聚合数据
4.2 转换数据
4.3 筛选数据
4.4 使用pandas.core.groupby.DataFrameGroupBy对象
4.5 使用多索引
第5课:Python和Pandas中的日期和时间
学习目标
5.1 使用Python的日期时间
5.2 转换为日期时间
5.3 加载带有日期的数据
5.4 提取时间成分
5.5 实现时间计算和时间增量
5.6 使用datetime方法
5.7 获取股票数据
5.8 基于日期提取数据
5.9 使用日期范围
5.10 平移值
5.11 进行重采样
5.12 时区的处理
第6课:建模,连接Pandas之外的世界
学习目标
6.1 线性回归
6.2 逻辑回归
6.3 泊松或负二项式模型
6.4 生存模型
6.5 模型诊断
6.6 正则化技术
6.7 聚类和主成分分析(PCA)
结语
用Python进行Pandas数据清理和建模:总结