Video description
课程简介
用Python数据科学和R LiveLessons是为了定制的初学者数据科学家寻求使用Python或R数据科学。本课程包括数据准备基础、数据分析、数据可视化、机器学习和交互式数据科学应用。学生们将学习如何建立预测模型,以及如何使用Anaconda平台为他们的业务线创建交互式可视化应用程序。本课程将介绍数据科学家如何使用Python和R来构建一个由数百种高性能开源工具组成的系统。
Get技能
● 使用Anaconda和Jupyter notebooks
● 了解开放数据科学概念、角色和工作流
● 用Pandas整理数据
● 了解Anaconda管理器的企业和协作工作流
● 使用Bokeh创建交互式可视化
● 使用Conda包管理
● 使用R进行数据处理和可视化
● 建立统计和预测模型
● 使用Excel和Python与Anaconda Fusion
● 了解并使用Mosaic处理分布式数据的数据库
● 了解Dask的分布式并行计算
Table of Contents
简介
使用Python和R的数据科学:简介
第1课:面向所有人的开放数据科学
学习目标
1.1使用Anaconda代码仓库进行数据科学工件
1.2使用Anaconda Navigator开发环境打开并运行Jupyter Notebooks
1.3执行基本的Jupyter操作
1.4用Pandas摄取、分析和清理数据
1.5使用Bokeh可视化数据
1.6使用Scikit Learn创建机器学习和预测建模
第2课:开放数据科学的背景概念
学习目标
2.1了解开放数据科学的概念
2.2确定开放数据科学团队中的不同角色
2.3了解开放数据科学工作流程
第3课:使用Pandas进行数据清洗
学习目标
3.1加载、查看和绘制Pandas数据框
3.2修改内容和创建新列
3.3使用boolean masks进行数据选择
3.4从磁盘读取数据
3.5数据分组
3.6连接到数据库
3.7使用时间序列数据
3.8读写Excel文件
3.9将代码发布到Anaconda Cloud
第4课:Anaconda环境管理器概述
学习目标
4.1描述Anaconda发行版本
4.2 熟悉Conda工具的用途
4.3关联Anaconda企业组件
4.4熟悉核心技术组件
4.5描述典型的数据科学工作流
4.6与团队一起在Anaconda企业版中创建项目
第5课:使用Bokeh创建交互式可视化
学习目标
5.1描述Bokeh
5.2用boke .charts绘制Pandas数据分析
5.3用bokeh.plotting管理绘图
5.4使用小部件和绘图链接进行交互性
5.5创建web绘图
5.6使用Bokeh服务器创建数据应用程序
第6课:Conda包管理工具
学习目标
6.1从Navigator安装软件包
6.2从Navigator添加channels
6.3从Navigator中升级、降级和删除包
6.4从Navigator创建一个新环境
6.5选择Conda环境和Jupyter内核
6.6从命令行使用Conda
6.7了解pip和conda之间的区别
6.8保持pip和conda最新
6.9导出、保存和共享Conda环境
6.10在Anaconda Cloud和Conda-Forge上查找包
第七课:R课程中的数据处理和可视化
学习目标
7.1配置一个R分析环境
7.2使用dplyr和tidyr访问和处理数据
7.3使用ggplot创建可视化效果
7.4使用线性模型进行预测分析
7.5使用rBokeh和Shiny创建交互式可视化
7.6用rpy2搭建R和Python之间的桥梁
第8课:构建统计和预测模型
学习目标
8.1使用Scikit-Learn创建一个预测模型
8.2用模型生成预测
8.3评分模型
8.4可视化模型性能
第9课:Anaconda Fusion的Excel和Python
学习目标
9.1了解Fusion解决了哪些问题
9.2安装并启动Fusion
9.3连接电子表格到编码表
第10课:使用Mosaic的数据库和分布式数据
学习目标
10.1了解Mosaic解决的问题
10.2安装并启动Mosaic
10.3使用Mosaic注册数据集和创建数据视图
第11课:Dask的分布式和并行计算
学习目标
11.1描述Dask与Dasks的关系
11.2描述Dask数据框的创建
11.3分析和绘制Dask数据
总结
使用Python和R的数据科学:总结