培訓(xùn):前端、Java、Python、大數(shù)據(jù)、軟件測(cè)試、物聯(lián)網(wǎng)、云計(jì)算、網(wǎng)絡(luò)安全、UI/UE設(shè)計(jì)...
大數(shù)據(jù)作為時(shí)下最火熱的IT行業(yè)的詞匯,隨之而來的數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭(zhēng)相追捧的利潤(rùn)焦點(diǎn)。隨著大數(shù)據(jù)時(shí)代的來臨,大數(shù)據(jù)分析也應(yīng)運(yùn)而生。如果您對(duì)大數(shù)據(jù)感興趣就來千鋒教育,如果您感興趣就來千鋒教育,千鋒教育致力于為企業(yè)提供全方位綜合人才服務(wù)等,下面有更詳細(xì)的課程介紹。
想從事大數(shù)據(jù)崗位人群
線下面授、線上直播、線上錄播、根據(jù)課程制定
隨到隨學(xué)
從入門到精通
成為大數(shù)據(jù)分析師人才
全面掌握所學(xué)企業(yè)實(shí)用技能
高薪入職國(guó)內(nèi)外名企成就自我
免費(fèi)試學(xué),簡(jiǎn)歷指導(dǎo),面試模擬,推薦全國(guó)就業(yè);
理論知識(shí)+項(xiàng)目實(shí)操+案例詳解+助教督學(xué)+就業(yè)指導(dǎo);
真實(shí)項(xiàng)目實(shí)戰(zhàn),課程內(nèi)容更新迭代快,適應(yīng)當(dāng)前技術(shù)發(fā)展需要
掌握能力
掌握企業(yè)級(jí)基建環(huán)境部署、Hive和Spark數(shù)據(jù)開發(fā)、數(shù)據(jù)倉(cāng)庫(kù)搭建、數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載、數(shù)據(jù)應(yīng)用和京東離線ETL。
勝任職位
離線數(shù)據(jù)工程師、數(shù)據(jù)倉(cāng)庫(kù)工程師、ETL工程師、數(shù)據(jù)采集工程師、數(shù)據(jù)支持工程師、BI商業(yè)分析師、數(shù)據(jù)可視化工程師、Hadoop工程師、Spark工程師
技術(shù)點(diǎn)
Java、MySQL、Maven、Git、OpenResty、Linux、Shell、HDFS、YARN、Zookeeper、MapReduce、Scala、Python、SparkCore、Hive、SparkSQL、Presto、Sqoop、DataX、Flume、CDH、數(shù)倉(cāng)架構(gòu)、維度建模、SuperSet、Azkaban、Airflow等。掌握企業(yè)級(jí)基建環(huán)境部署、Hive和Spark數(shù)據(jù)開發(fā)、數(shù)據(jù)倉(cāng)庫(kù)搭建、數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載、數(shù)據(jù)應(yīng)用和京東離線ETL。
項(xiàng)目
數(shù)據(jù)服務(wù)、大數(shù)據(jù)可視化、企業(yè)級(jí)Hadoop基建項(xiàng)目部署、分布式網(wǎng)絡(luò)爬蟲、基于Spark的大數(shù)據(jù)分析項(xiàng)目、ETL項(xiàng)目之Hive和SparkSQL、BI商業(yè)分析等。
掌握能力
掌握流數(shù)據(jù)接入、基于Flink實(shí)時(shí)數(shù)據(jù)開發(fā)、流批一體數(shù)據(jù)倉(cāng)庫(kù)開發(fā)、數(shù)據(jù)湖開發(fā)、實(shí)時(shí)ETL、實(shí)時(shí)監(jiān)控系統(tǒng)和京東實(shí)時(shí)數(shù)據(jù)開發(fā)
勝任職位
實(shí)時(shí)工程師、Flink工程師、實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)工程師、實(shí)時(shí)ETL工程師、Spark工程師
技術(shù)點(diǎn)
Kafka、Structured Streaming、Hudi、Canal、Flink、ClickHouse、HBase、Phoenix、Elasticsearch、Redis
項(xiàng)目
實(shí)時(shí)監(jiān)控系統(tǒng)、基于Flink的實(shí)時(shí)數(shù)據(jù)開發(fā)、實(shí)時(shí)數(shù)據(jù)湖、大數(shù)據(jù)搜索系統(tǒng)
掌握能力
掌握企業(yè)項(xiàng)目開發(fā)流程、用戶畫像開發(fā)、企業(yè)級(jí)推薦系統(tǒng)開發(fā)、數(shù)據(jù)治理、基于生產(chǎn)環(huán)境項(xiàng)目部署和京東項(xiàng)目性能調(diào)優(yōu)
勝任職位
數(shù)據(jù)服務(wù)工程師、離線數(shù)據(jù)倉(cāng)庫(kù)開發(fā)工程師、BI商業(yè)分析師、實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)工程師、實(shí)時(shí)監(jiān)控系統(tǒng)工程師、ETL工程師、數(shù)據(jù)可視化工程師、數(shù)據(jù)治理工程師、高級(jí)數(shù)據(jù)開發(fā)工程師、推薦工程、數(shù)據(jù)平臺(tái)工程師、數(shù)據(jù)架構(gòu)師
技術(shù)點(diǎn)
數(shù)據(jù)采集與監(jiān)控平臺(tái)、準(zhǔn)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)、用戶畫像、推薦系統(tǒng)、基于Flink的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)、元數(shù)據(jù)管理與數(shù)據(jù)治理。
千鋒與京東物流合作共建大數(shù)據(jù)培訓(xùn)課程體系,企業(yè)熱門技術(shù)全方位涵蓋 融入真實(shí)項(xiàng)目案例和工程實(shí)踐創(chuàng)新
項(xiàng)目介紹
隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)源頭越來越多且是分散的,除了業(yè)務(wù)庫(kù),APP 埋點(diǎn),web 網(wǎng)站 log,LOT 設(shè)備等會(huì)產(chǎn)生各種各樣的海量數(shù)據(jù),這些數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前(或之后),需要進(jìn)行統(tǒng)一(字段定義、主題歸屬、項(xiàng)目劃分等),數(shù)據(jù)集成在一起。離線數(shù)倉(cāng)的ETL,涵蓋數(shù)據(jù)的抽取轉(zhuǎn)換與加載。
項(xiàng)目目標(biāo)
在數(shù)據(jù)倉(cāng)庫(kù)中構(gòu)建模型,從數(shù)據(jù)源中抽取數(shù)據(jù),然后對(duì)這些數(shù)據(jù)進(jìn)行轉(zhuǎn)化,最終加載到目標(biāo)數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)中去,實(shí)現(xiàn)離線數(shù)倉(cāng)ETL的過程。
項(xiàng)目介紹
企業(yè)信息化發(fā)展,數(shù)據(jù)源豐富,數(shù)據(jù)量比以往結(jié)構(gòu)化的數(shù)據(jù)大了幾個(gè)量級(jí),對(duì) ETL 過程、存儲(chǔ)都提出了更高的要求。互聯(lián)網(wǎng)的在線特性也對(duì)實(shí)時(shí)性提出了要求,如用戶反欺詐、用戶審核等隨著用戶的暴漲。實(shí)時(shí)數(shù)據(jù)開發(fā),主要是對(duì)由用戶行為、業(yè)務(wù)行為等產(chǎn)生的巨大量數(shù)據(jù)進(jìn)行實(shí)時(shí)處理,并應(yīng)用到生產(chǎn)中。
項(xiàng)目目標(biāo)
基于分層的模型 ods/dwd/dws/,業(yè)務(wù)數(shù)據(jù)和日志數(shù)據(jù),事實(shí)數(shù)據(jù)存儲(chǔ)在 kafka 中,維度數(shù)據(jù)存儲(chǔ)在 Hbase/Tair 中,dm 層的數(shù)據(jù)最終導(dǎo)出到 mq/olap/rds/kv 中。ad-hoc 查詢基于 Flink 來做。實(shí)時(shí)數(shù)倉(cāng)的存儲(chǔ)需考慮支持?jǐn)?shù)據(jù)重放,方便支持任務(wù)重跑。選擇一個(gè)具有重放功能的、能夠保存歷史數(shù)據(jù)并支持多消費(fèi)者的消息隊(duì)列,根據(jù)需求設(shè)置歷史數(shù)據(jù)保存的時(shí)長(zhǎng),通過實(shí)時(shí)數(shù)據(jù)開發(fā),建成實(shí)時(shí)數(shù)倉(cāng)、實(shí)時(shí)指標(biāo)等,支撐企業(yè)鏈路的實(shí)時(shí)化。
項(xiàng)目介紹
大數(shù)據(jù)采集與指標(biāo)監(jiān)控項(xiàng)目是基于第一階段和第二階段課程,貫穿離線數(shù)據(jù)上報(bào)、數(shù)據(jù)儲(chǔ)存、數(shù)據(jù)服務(wù)監(jiān)控、數(shù)據(jù)分析等全套流程。整個(gè)項(xiàng)目包括Flume自定義攔截器代碼、自定義Azkaban監(jiān)控代碼和SQL相關(guān)指標(biāo)代碼開發(fā)。
項(xiàng)目目標(biāo)
解決離線數(shù)據(jù)上報(bào)流程,數(shù)據(jù)采集操作,flume和azkaban的二次開發(fā),數(shù)據(jù)服務(wù)監(jiān)控,離線數(shù)據(jù)開發(fā)流程。
項(xiàng)目介紹
HDFS+Flume+Sqoop+數(shù)倉(cāng)思想+Spark
SQL/Hive+Azkaban+Python+Shell+Superset大數(shù)據(jù)離線數(shù)倉(cāng)解決方案。
項(xiàng)目目標(biāo)
1 采集和同步架構(gòu)組件采用: Sqoop+Flume
2數(shù)倉(cāng)架構(gòu)組件采用:HDFS+SparkSQL/Hive
3 任務(wù)調(diào)度架構(gòu)采用:Azkaban+Python/Shell
4 涉及到數(shù)倉(cāng)思想: 分層+建模+維度+粒度+拉鏈+增量/全量+數(shù)據(jù)質(zhì)量等
5 本項(xiàng)目中的BI工具: Superset
項(xiàng)目介紹
準(zhǔn)實(shí)時(shí)數(shù)倉(cāng)是一個(gè)集流式數(shù)據(jù)集成,數(shù)據(jù)分析、DAU預(yù)測(cè)和數(shù)據(jù)應(yīng)用的數(shù)倉(cāng)型項(xiàng)目。整個(gè)項(xiàng)目架構(gòu)為Nginx+OpenResty+Kafka+Spark+Presto等技術(shù)構(gòu)成。
項(xiàng)目目標(biāo)
解決事件行為分析。
解決企業(yè)留存分析。
解決漏斗分析。
解決DAU預(yù)測(cè)及數(shù)據(jù)服務(wù)提供。
項(xiàng)目介紹
用戶畫像是基于數(shù)倉(cāng)之上的項(xiàng)目,主要解決畫像標(biāo)簽服務(wù),比如人群圈定服務(wù)和相似用戶搜索服務(wù)等。同時(shí)標(biāo)簽的處理使用Word2Vec、TF-IDF、HanLP分詞等技術(shù)。
項(xiàng)目目標(biāo)
解決企業(yè)人群圈定。
解決相似用戶搜索。