Video description
课程简介
Data Science Fundamentals LiveLessons将教给你成为一名有效的数据科学家所需要的基本概念、理论和技术。这些视频向你展示了Python及其相关库系统中应用的、示例驱动的课程,在这些课程中,你可以使用真实的数据集并看到真实的结果。在此过程中,你将学习专业数据科学家使用的最佳实践和计算技术。更具体地说,你将学习如何通过使用API获取Internet上可公开访问的数据。你将学习如何解析XML和JSON数据,将其加载到关系数据库中。
Get技能
如何获得和使用Python运行时数据科学环境
● Python 3的基本内容,包括面向对象编程
● 数据科学过程的基础知识和每个步骤的必要条件
● 如何为Airbnb列表建立一个简单(但强大)的推荐引擎
● 在哪里可以找到高质量的数据源,以及如何以编程方式使用API
● 将JSON和XML解析为结构化形式的策略
● 关系数据库的基础知识,以及如何在Python中使用ORM与之交互
● 数据验证的最佳实践,包括常见的数据质量检查
Table of Contents
简介
数据科学基础第1部分:简介
第1课:用Python介绍数据科学
主题
1.1欢迎来到本课程
1.2为什么是数据科学,为什么是现在?
1.3数据科学的潜力
1.4建立数据科学开发环境
1.5 Python(3)引语
Python 2与Python 3的对比
1.7测试你的知识:Wordbuzz
1.8 Wordbuzz:把它们放在一起
1.9 Python回顾和参考资料
1.10 Python用于数据科学
1.11 Äôs来了
第2课:数据科学过程:构建第一个应用程序
主题
2.1数据科学过程介绍
2.2定义你的问题
2.3获取数据
2.4整理数据
2.5探索数据
2.6通过三角闭合的建议
2.7 Python开发流程
2.8 Python中的三元闭包
2.9推荐系统的挑战
2.10获得评价基线
2.11检查和评价结果
2.12展示和传播
2.13数据科学的应用——更便宜的床,更好的早餐
第三课:获取数据——源和方法
主题
3.1数据科学思维
3.2数据科学技术栈
3.3数据来源:来源和服务
3.4网络的工作原理
3.5使用Python进行HTTP请求
3.6用开放数据添加上下文
3.7用Python——JSON和XML解析数据
3.8数据和文件格式
3.9使用API
3.10 使用Python参数化API请求
3.11探索Foursquare API
3.12下载Foursquare Venues
第4课:添加结构解析数据和数据模型
主题
4.1 ETL管道介绍
4.2数据模型——为数据添加结构
4.3构建抽象——面向对象编程
4.4用Python创建类
4.5定义方法和更新状态
4.6魔法方法、类属性和内省
4.7探索并组织Foursquare的响应
4.8应用数据模型——用类表示Foursquare实体
4.9用方法建模行为
4.10使用Setter方法和虚拟属性定制模型接口
4.11让事情DRY通过继承
4.12面向对象编程用例
4.13支持(和反对)OOP的理由
第5课: 存储数据——使用关系数据库的持久性
主题
5.1 SQLite数据库介绍
5.2使用SQLite shell检查数据库
5.3数据库概况
5.4模式中有什么?将数据模型映射到数据表
5.5对象关系映射器介绍
5.6 Python中的ORM和peewee
5.7使用peewee创建和查询记录
5.8 Python中的端到端ETL
5.9 ORMs的优点和缺点
5.10提取、转换、加载——将它们放在一起
第6课:验证数据来源和质量控制
主题
6.1探索性数据分析介绍
6.2使用图形工具快速理解数据
6.3使用peewee检查数据库和构建模式
6.4与peewee进行数据质量检查
6.5使用peewee查找丢失的数据和空值
6.6处理丢失数据
6.7隐含描述数据的EDA
6.8在peewee中检查查询和显示结果
6.9 peewee分组和聚集
6.10对Venues进行排名和排序
6.11 SQL关系和连接
6.12与peewee连接
6.13使用连接跨数据集查询
6.14将peewee翻译成SQL
6.15 SQL连接的可视化介绍
总结
总结