数据仓库项目在整个大数据体系中的重要性不言而喻,是入行大数据的敲门砖,是整个大数据体系的基石。尚硅谷大数据全新升级的离线数据仓库项目:尚品汇,由尚硅谷研究院精心研发,不仅仅是一个大数据项目,尚硅谷的Java团队和前端团队也全部参与其中,按照真实的项目开发流程,实现与Java和前端的无缝互联,历时半年精心打磨,倾力推出! 教程涵盖Apache生态系统的所有主流技术:Hadoop、Hive、Spark、Flume、Kafka、Azkaban、Zookeeper、Sqoop、Atlas、Kylin、Presto、Kerberos、Ranger、Zabbix等,均采用了稳定版。数据治理内容更加全面,搭建Kerberos+Ranger的一体化权限管理系统,使用Python+Shell脚本实现自动化数据质量监控,使用Zabbix+Grafana实现集群性能监控,采用目前企业主流的元数据管理应用Atlas实现了数据血缘管理,保障了数仓的安全性、一致性和可靠性。 数据仓库建模理论是整个数据仓库的核心部分,本套视频教程对数据仓库理论部分进行了大幅扩充,对维度建模、关系建模理论的讲解更加透彻,新增了数据仓库理论热门名词概念讲解。通过本套教程的学习,你可以掌握数据仓库建模的各种理论知识,从零开始搭建一套数据仓库系统,掌握主流的大数据相关技术,对数据仓库的整体构架有一个完整的认识。本套教程的数据仓库项目与企业真实项目无缝对接,实现需求的思路可直接嫁接至现实工作中,可以为你在大数据开发过程中遇到难题提供更多的解决问题思路。 本套教程延续了往期数据仓库视频的特点,讲解细致清楚,每一条SQL语句,每一行代码都讲得明明白白,教程配套的项目源码、文档资料、软件安装包等均可免费获取。教程适合具备一定大数据技术基础的学习者,需掌握Linux的日常操作,了解Hadoop生态的基础框架。
视频目录 001.尚硅谷_电商数仓-课程介绍002.尚硅谷_数仓概念-数据来源003.尚硅谷_数仓概念-项目演示004.尚硅谷_数仓概念-总体描述005.尚硅谷_数仓需求-需求分析006.尚硅谷_数仓架构-选型考虑因素007.尚硅谷_数仓架构-技术选型008.尚硅谷_数仓架构-项目流程设计009.尚硅谷_数仓架构-框架发行版本选择010.尚硅谷_数仓架构-具体版本011.尚硅谷_数仓架构-服务器选择012.尚硅谷_数仓架构-集群规模013.尚硅谷_数仓架构-集群资源规划设计014.尚硅谷_用户行为数据生成-页面日志介绍015.尚硅谷_用户行为数据生成-事件日志介绍016.尚硅谷_用户行为数据生成-曝光日志介绍017.尚硅谷_用户行为数据生成-启动及错误日志介绍018.尚硅谷_用户行为数据生成-埋点方式019.尚硅谷_用户行为数据生成-埋点上报时机020.尚硅谷_用户行为数据生成-埋点日志格式021.尚硅谷_用户行为数据生成-模板服务器说明022.尚硅谷_用户行为数据生成-克隆三台服务器023.尚硅谷_用户行为数据生成-阿里云准备(可选)024.尚硅谷_用户行为数据生成-集群同步脚本025.尚硅谷_用户行为数据生成-无密登录配置026.尚硅谷_用户行为数据生成-安装JDK027.尚硅谷_用户行为数据生成-Linux环境变量说明028.尚硅谷_用户行为数据生成-日志生成029.尚硅谷_用户行为数据生成-日志生成脚本030.尚硅谷_用户行为数据采集-xcall脚本031.尚硅谷_用户行为数据采集-Hadoop安装032.尚硅谷_用户行为数据采集-Hadoop配置(上)033.尚硅谷_用户行为数据采集-Hadoop配置(下)034.尚硅谷_用户行为数据采集-Hadoop历史服务器&日志聚集035.尚硅谷_用户行为数据采集-Hadoop集群启动036.尚硅谷_用户行为数据采集-Hadoop集群启停脚本037.尚硅谷_用户行为数据采集-Hadoop存储多目录038.尚硅谷_用户行为数据采集-Hadoop节点间数据均衡039.尚硅谷_用户行为数据采集-Hadoop磁盘间数据均衡040.尚硅谷_用户行为数据采集-Hadoop配置支持LZO压缩041.尚硅谷_用户行为数据采集-Hadoop配置LZO创建索引042.尚硅谷_用户行为数据采集-Hadoop压测环境准备043.尚硅谷_用户行为数据采集-Hadoop压测写测试044.尚硅谷_用户行为数据采集-Hadoop压测读测试045.尚硅谷_用户行为数据采集-Hadoop压测MR计算046.尚硅谷_用户行为数据采集-Hadoop的HDFS参数调优047.尚硅谷_用户行为数据采集-Hadoop的Yarn参数调优048.尚硅谷_用户行为数据采集-Zookeeper安装049.尚硅谷_用户行为数据采集-Zookeeper脚本050.尚硅谷_用户行为数据采集-Kafka安装051.尚硅谷_用户行为数据采集-Kafka脚本052.尚硅谷_用户行为数据采集-Kafka的API回顾053.尚硅谷_用户行为数据采集-Kafka机器数量054.尚硅谷_用户行为数据采集-Kafka压测环境准备055.尚硅谷_用户行为数据采集-Kafka生产压测056.尚硅谷_用户行为数据采集-Kafka消费压测057.尚硅谷_用户行为数据采集-Kafka分区数058.尚硅谷_用户行为数据采集-Flume安装059.尚硅谷_用户行为数据采集-Flume的Source选择060.尚硅谷_用户行为数据采集-Flume的Channel选择061.尚硅谷_用户行为数据采集-Flume的KafkaChannel062.尚硅谷_用户行为数据采集-Flume配置编写063.尚硅谷_用户行为数据采集-Flume拦截器单Event064.尚硅谷_用户行为数据采集-Flume拦截器和配置完成065.尚硅谷_用户行为数据采集-Flume-Kafka通道打通066.尚硅谷_用户行为数据采集-Flume脚本nohup067.尚硅谷_用户行为数据采集-Flume脚本停止进程068.尚硅谷_用户行为数据采集-Flume脚本完成069.尚硅谷_用户行为数据采集-消费者Flume组件选型070.尚硅谷_用户行为数据采集-消费者Flume零点漂移说明071.尚硅谷_用户行为数据采集-消费者Flume配置Source072.尚硅谷_用户行为数据采集-消费者Flume配置Channel073.尚硅谷_用户行为数据采集-消费者Flume配置Sink074.尚硅谷_用户行为数据采集-消费者Flume时间戳拦截器075.尚硅谷_用户行为数据采集-消费者Flume时间戳拦截器完成076.尚硅谷_用户行为数据采集-消费者Flume小文件问题处理077.尚硅谷_用户行为数据采集-消费者Flume脚本完成078.尚硅谷_用户行为数据采集-消费者Flume内存优化079.尚硅谷_用户行为数据采集-采集通道总脚本080.尚硅谷_用户行为数据采集-2NN的bug解决081.尚硅谷_业务数据采集-电商业务流程082.尚硅谷_业务数据采集-业务数据库(上)083.尚硅谷_业务数据采集-业务数据库(中)084.尚硅谷_业务数据采集-业务数据库(下)085.尚硅谷_业务数据采集-安装MySQL086.尚硅谷_业务数据采集-生成业务数据087.尚硅谷_业务数据采集-Sqoop部署088.尚硅谷_业务数据采集-Sqoop使用089.尚硅谷_业务数据采集-同步策略090.尚硅谷_业务数据采集-同步策略分析091.尚硅谷_业务数据采集-Sqoop同步命令编写092.尚硅谷_业务数据采集-Sqoop同步脚本093.尚硅谷_业务数据采集-部署Hive094.尚硅谷_数仓建模理论-数仓分层概念095.尚硅谷_数仓建模理论-数据集市概念096.尚硅谷_数仓建模理论-开发规范097.尚硅谷_数仓建模理论-概述098.尚硅谷_数仓建模理论-范式概念099.尚硅谷_数仓建模理论-数仓概述100.尚硅谷_数据仓库理论-三范式理论101.尚硅谷_数仓建模理论-关系建模和维度建模102.尚硅谷_数仓建模理论-维度表和事实表103.尚硅谷_数仓建模理论-维度模型分类104.尚硅谷_数仓建模理论-ODS层建模思想105.尚硅谷_数仓建模理论-DIM层和DWD层建模思想106.尚硅谷_数仓建模理论-DIM层和DWD层建模演示107.尚硅谷_数仓建模理论-DWS层和DWT层建模思想108.尚硅谷_数仓建模理论-ADS层建表说明109.尚硅谷_数仓环境搭建-计算模式分析110.尚硅谷_数仓环境搭建-Hive-on-Spark兼容性问题说明111.尚硅谷_数仓环境搭建-Hive-on-Spark配置112.尚硅谷_数仓环境搭建-Hive-on-Spark测试113.尚硅谷_数仓环境搭建-Yarn配置114.尚硅谷_数仓环境搭建-DataGrip使用说明115.尚硅谷_数仓环境搭建-数据准备116.尚硅谷_数仓搭建-ODS层日志表建表语句117.尚硅谷_数仓搭建-ODS层日志表数据装载118.尚硅谷_数仓搭建-ODS层日志表装载脚本119.尚硅谷_数仓搭建-ODS层业务表建表语句120.尚硅谷_数仓搭建-ODS层业务表装载脚本121.尚硅谷_数仓搭建-DIM层商品维度表建表语句122.尚硅谷_数仓搭建-DIM层商品维度表数据装载分析123.尚硅谷_数仓搭建-DIM层商品维度表数据装载语句124.尚硅谷_数仓搭建-LZO索引文件失效说明125.尚硅谷_数仓搭建-DIM层优惠券维度表建表语句126.尚硅谷_数仓搭建-DIM层优惠券维度表数据装载127.尚硅谷_数仓搭建-DIM层活动维度表建表语句128.尚硅谷_数仓搭建-DIM层活动维度表装载语句129.尚硅谷_数仓搭建-DIM层地区维度表130.尚硅谷_数仓搭建-DIM层时间维度表131.尚硅谷_数仓搭建-拉链表概述132.尚硅谷_数仓搭建-DIM层用户维度表建表语句133.尚硅谷_数仓搭建-DIM层用户维度表数据装载思路134.尚硅谷_数仓搭建-DIM层用户维度表首日数据装载135.尚硅谷_数仓搭建-DIM层用户维度表每日数据装载136.尚硅谷_数仓搭建-DIM层数据装载脚本137.尚硅谷_数仓搭建-DWD层日志解析思路138.尚硅谷_数仓搭建-get_json_object函数139.尚硅谷_数仓搭建-DWD层启动日志表建表语句140.尚硅谷_数仓搭建-DWD层启动日志表数据装载141.尚硅谷_数仓搭建-DWD层页面日志表142.尚硅谷_数据仓库-DWD层动作日志表建表语句143.尚硅谷_数仓搭建-DWD层动作日志表数据装载思路144.尚硅谷_数仓搭建-UDTF函数编码145.尚硅谷_数仓搭建-UDTF函数创建146.尚硅谷_数仓搭建-DWD层动作日志表数据装载147.尚硅谷_数仓搭建-DWD层曝光日志表148.尚硅谷_数仓搭建-DWD层错误日志表149.尚硅谷_数仓搭建-DWD层数据装载脚本150.尚硅谷_数仓搭建-维度建模回顾151.尚硅谷_数仓搭建-DWD层评价事实表建表语句152.尚硅谷_数仓搭建-DWD层评价事实表数据装载153.尚硅谷_数仓搭建-DWD层订单明细事实表建表语句154.尚硅谷_数仓搭建-DWD层订单明细事实表数据装载155.尚硅谷_数仓搭建-DWD层退单事实建表语句156.尚硅谷_数仓搭建-DWD层退单事实表数据装载157.尚硅谷_数仓搭建-DWD层加购事实表158.尚硅谷_数仓搭建-DWD层收藏事实表159.尚硅谷_数仓搭建-DWD层优惠券领用事实表建表语句160.尚硅谷_数仓搭建-DWD层优惠券领用事实表数据装载161.尚硅谷_数仓搭建-DWD层支付事实表建表语句162.尚硅谷_数仓搭建-DWD层支付事实表数据装载163.尚硅谷_数仓搭建-DWD层退款事实表164.尚硅谷_数仓搭建-DWD层订单事实表建表语句165.尚硅谷_数仓搭建-DWD层订单事实表数据装载166.尚硅谷_数仓搭建-DWD层数据装载脚本167.尚硅谷_数仓搭建-DWS层建模回顾168.尚硅谷_数仓搭建-Hive时间函数和复杂数据类型说明169.尚硅谷_数仓搭建-DWS层用户主题建表语句170.尚硅谷_数仓搭建-DWS层用户主题数据装载思路分析171.尚硅谷_数仓搭建-DWS层用户主题首日数据装载(上)172.尚硅谷_数仓搭建-DWS层用户主题首日数据装载(中)173.尚硅谷_数仓搭建-DWS层用户主题首日数据装载(下)174.尚硅谷_数仓搭建-DWS层用户主题每日数据装载175.尚硅谷_数仓搭建-DWS层访客主题建表语句176.尚硅谷_数仓搭建-新增访客判断逻辑说明177.尚硅谷_数仓搭建-DWS层访客主题数据装载178.尚硅谷_数仓搭建-DWS层商品主题建表语句179.尚硅谷_数仓搭建-DWS层商品主题数据装载180.尚硅谷_数仓搭建-DWS其余主题表结构181.尚硅谷_数仓搭建-DWS数据装载脚本182.尚硅谷_数仓搭建-DWT层建模思想回顾183.尚硅谷_数仓搭建-DWT用户主题建表语句184.尚硅谷_数仓搭建-DWT用户主题首日数据装载185.尚硅谷_数仓搭建-DWT用户主题每日数据装载186.尚硅谷_数仓搭建-DWT访客主题建表语句187.尚硅谷_数仓搭建-DWT访客主题数据装载188.尚硅谷_数仓搭建-DWT层其余主题表结构189.尚硅谷_数仓搭建-DWT层数据装载脚本190.尚硅谷_数仓搭建-ADS层访客统计需求说明191.尚硅谷_数仓搭建-ADS层访客统计需求讲解(上)192.尚硅谷_数仓搭建-ADS层访客统计需求讲解(下)193.尚硅谷_数仓搭建-ADS层路径分析需求说明194.尚硅谷_数仓搭建-ADS层路径分析需求讲解195.尚硅谷_数仓搭建-ADS层用户统计需求说明196.尚硅谷_数仓搭建-ADS层用户统计需求讲解197.尚硅谷_数仓搭建-ADS层用户变动统计需求说明198.尚硅谷_数仓搭建-ADS层用户变动统计需求讲解199.尚硅谷_数仓搭建-ADS层漏斗分析需求说明200.尚硅谷_数仓搭建-ADS层漏斗分析需求讲解201.尚硅谷_数仓搭建-ADS层留存率需求说明202.尚硅谷_数仓搭建-ADS层留存率需求讲解203.尚硅谷_数仓搭建-ADS层商品统计204.尚硅谷_数仓搭建-ADS层复购率205.尚硅谷_数仓搭建-ADS层订单统计206.尚硅谷_数仓搭建-ADS层各地区订单统计207.尚硅谷_数仓搭建-ADS层优惠券统计208.尚硅谷_数仓搭建-ADS层活动统计209.尚硅谷_数仓搭建-ADS层数据装载脚本210.尚硅谷_全流程调度-概述211.尚硅谷_全流程调度-Azkaban概述212.尚硅谷_全流程调度-Azkaban基本架构及部署模式213.尚硅谷_全流程调度-Azkaban部署之数据库初始化214.尚硅谷_全流程调度-Azkaban部署之ExecutorServer215.尚硅谷_全流程调度-Azkaban部署之WebServer216.尚硅谷_全流程调度-Azkaban使用之HelloWorld案例217.尚硅谷_全流程调度-Azkaban使用之配置文件编写规则218.尚硅谷_全流程调度-Azkaban使用之任务依赖案例219.尚硅谷_全流程调度-Azkaban使用之自动失败重试案例220.尚硅谷_全流程调度-Azkaban使用之手动失败重试案例221.尚硅谷_全流程调度-Azkaban进阶之JavaProcess任务类型222.尚硅谷_全流程调度-Azkaban进阶之条件工作流概述223.尚硅谷_全流程调度-Azkaban进阶之条件工作流运行时参数案例224.尚硅谷_全流程调度-Azkaban进阶之条件工作流预定义宏案例225.尚硅谷_全流程调度-Azkaban进阶之定时调度226.尚硅谷_全流程调度-Azkaban进阶之邮件报警227.尚硅谷_全流程调度-Azkaban进阶之电话报警228.尚硅谷_全流程调度-Azkaban进阶之多Executor模式注意事项229.尚硅谷_全流程调度-工作流程图230.尚硅谷_全流程调度-Mysql建库建表231.尚硅谷_全流程调度-Sqoop导出脚本232.尚硅谷_全流程调度-新数据准备233.尚硅谷_全流程调度-实操234.尚硅谷_可视化-Superset概述235.尚硅谷_可视化-Superset部署之Miniconda3236.尚硅谷_可视化-Superset部署之Python环境237.尚硅谷_可视化-Superset部署之安装238.尚硅谷_可视化-Superset部署之启停239.尚硅谷_可视化-Superset使用之对接数据源240.尚硅谷_可视化-Superset使用之创建仪表盘241.尚硅谷_可视化-Superset使用之创建Charts242.尚硅谷_可视化-Superset使用之桑基图&地图243.尚硅谷_可视化-Superset使用之仪表盘布局调整244.尚硅谷_即席查询-Kylin概述245.尚硅谷_即席查询-Kylin前置概念246.尚硅谷_即席查询-Kylin架构-n247.尚硅谷_即席查询-Kylin部署之HBase248.尚硅谷_即席查询-Kylin部署之环境变量249.尚硅谷_即席查询-Kylin特点250.尚硅谷_即席查询-Kylin启动及问题说明251.尚硅谷_即席查询-Kylin使用之对接数据源252.尚硅谷_即席查询-Kylin使用之构建Model253.尚硅谷_即席查询-Kylin使用之构建Cube254.尚硅谷_即席查询-Kylin进阶之重复key问题255.尚硅谷_即席查询-Kylin进阶之每日调度脚本256.尚硅谷_即席查询-Kylin理论之Cube原理257.尚硅谷_即席查询-Kylin优化之聚合组258.尚硅谷_即席查询-Kylin优化之衍生维度259.尚硅谷_即席查询-Kylin优化之RowKey260.尚硅谷_即席查询-KylinBI集成261.尚硅谷_即席查询-Presto概述262.尚硅谷_即席查询-Presto部署之Server263.尚硅谷_即席查询-Presto部署之命令行客户端264.尚硅谷_即席查询-Presto部署之LZO说明265.尚硅谷_即席查询-Presto部署之可视化客户端266.尚硅谷_即席查询-Presto注意事项267.尚硅谷_集群监控-Zabbix概述268.尚硅谷_集群监控-Zabbix部署之准备工作269.尚硅谷_集群监控-Zabbix部署之yum仓库准备270.尚硅谷_集群监控-Zabbix部署之安装271.尚硅谷_集群监控-Zabbix部署之配置272.尚硅谷_集群监控-Zabbix使用之简介273.尚硅谷_集群监控-Zabbix使用之术语274.尚硅谷_集群监控-Zabbix使用之创建主机275.尚硅谷_集群监控-Zabbix使用之创建监控项276.尚硅谷_集群监控-Zabbix使用之创建触发器277.尚硅谷_集群监控-Zabbix使用之创建动作278.尚硅谷_集群监控-Zabbix使用之测试&模板279.尚硅谷_集群监控-Zabbix使用之集成Grafana280.尚硅谷_用户认证-Kerberos概述281.尚硅谷_用户认证-Kerberos认证原理282.尚硅谷_用户认证-Kerberos部署之配置283.尚硅谷_用户认证-Kerberos部署之初始化数据库284.尚硅谷_用户认证-Kerberos部署之创建管理员用户285.尚硅谷_用户认证-Kerberos使用之数据库操作286.尚硅谷_用户认证-Kerberos使用之用户认证287.尚硅谷_用户认证-Kerberos集成Hadoop之创建系统用户288.尚硅谷_用户认证-Kerberos集成Hadoop之创建Kerberos主体289.尚硅谷_用户认证-Kerberos集成Hadoop之修改配置文件290.尚硅谷_用户认证-Kerberos集成Hadoop之HTTPS协议说明291.尚硅谷_用户认证-Kerberos集成Hadoop之HTTPS配置292.尚硅谷_用户认证-Kerberos集成Hadoop之配置LinuxContainorExecutor293.尚硅谷_用户认证-Kerberos集成Hadoop之修改本地路径权限294.尚硅谷_用户认证-Kerberos集成Hadoop之启动HDFS295.尚硅谷_用户认证-Kerberos集成Hadoop之修改HFDS路径权限296.尚硅谷_用户认证-Kerberos集成Hadoop之启动Yarn&历史服务器297.尚硅谷_用户认证-Kerberos实操之用户要求298.尚硅谷_用户认证-Kerberos实操之访问HDFS299.尚硅谷_用户认证-Kerberos实操之访问Yarn300.尚硅谷_用户认证-Kerberos实操之Hive启用认证301.尚硅谷_用户认证-Kerberos实操之HiveBeeline客户端认证302.尚硅谷_用户认证-Kerberos实操之HiveDataGrip认证303.尚硅谷_用户认证-Kerberos实战全流程调度之准备工作304.尚硅谷_用户认证-Kerberos实战全流程调度之新数据准备305.尚硅谷_用户认证-Kerberos实战全流程调度之启动Azkaban306.尚硅谷_用户认证-Kerberos实战全流程调度之演示307.尚硅谷_用户认证-Kerberos实战Presto之准备工作308.尚硅谷_用户认证-Kerberos实战Presto之修改配置文件309.尚硅谷_用户认证-Kerberos实战Presto之配置映射规则&代理用户310.尚硅谷_用户认证-Kerberos实战Presto之认证测试311.尚硅谷_用户认证-Kerberos实战Kylin之HBase认证312.尚硅谷_用户认证-Kerberos实战Kylin之认证测试313.尚硅谷_权限管理-Ranger概述314.尚硅谷_权限管理-Ranger部署之用户准备315.尚硅谷_权限管理-Ranger部署之数据库初始化316.尚硅谷_权限管理-Ranger部署之安装RangerAdmin317.尚硅谷_权限管理-Ranger部署之安装UserSynce318.尚硅谷_权限管理-Ranger部署之安装Hive插件319.尚硅谷_权限管理-Ranger部署之配置Hive插件-nn320.尚硅谷_权限管理-Ranger使用之授权管理321.尚硅谷_权限管理-Ranger理论之授权模型322.尚硅谷_元数据管理-Atlas概述323.尚硅谷_元数据管理-Atlas部署之Solr324.尚硅谷_元数据管理-Atlas部署之集成各组件325.尚硅谷_元数据管理-Atlas部署之集成Hive326.尚硅谷_元数据管理-Atlas使用之启动327.尚硅谷_元数据管理-Atlas使用之元数据初次导入328.尚硅谷_元数据管理-Atlas使用之全流程调度329.尚硅谷_元数据管理-Atlas使用之查看血缘依赖关系330.尚硅谷_数据质量管理-概述331.尚硅谷_数据质量管理-需求分析和功能模块332.尚硅谷_数据质量管理-Python开发环境准备333.尚硅谷_数据质量管理-Mysql环境准备334.尚硅谷_数据质量管理-检测模块(上)335.尚硅谷_数据质量管理-检测模块(下)336.尚硅谷_数据质量管理-告警集成模块337.尚硅谷_数据质量管理-调度模块(上)338.尚硅谷_数据质量管理-调度模块(中)339.尚硅谷_数据质量管理-调度模块(下)340.尚硅谷_数据质量管理-可视化模块