簡介:百度搜索引擎的檢索功能最核心的是實現(xiàn)了海量數(shù)據(jù)下多條件快速復雜查詢的功能,目前在大數(shù)據(jù)領域中,Elasticsearch可以實現(xiàn)海量數(shù)據(jù)下的快速復雜查詢,再借助于HBase的海量數(shù)據(jù)存儲能力,二者結合到一起,可以輕松構建一套百度搜索引擎平臺。本次體驗課將由慕課網(wǎng)《大數(shù)據(jù)工程師》體系課程主講老師帶著大家一起構建一套屬于你自己的百度搜索引擎。
第1章 企業(yè)中快速復雜查詢痛點分析
本章中,將針對目前大數(shù)據(jù)領域海量數(shù)據(jù)存儲現(xiàn)狀、常見的SQL分析引擎、以及常見的全文檢索引擎進行分析。
第2章 仿百度搜索引擎項目架構設計
本章中,將整體分析仿百度搜索引擎項目的整體架構流程,并且詳細分析了數(shù)據(jù)同步的三種方案。
第3章 ES高級特性擴展
本章中,將針對Elasticsearch中的高級特性進行擴展,包括_source、index、store特性。
第4章 開發(fā)仿百度搜索引擎項目
本章中,將詳細分析項目整體開發(fā)需求,分步驟進行開發(fā),最終從0~1成功運行項目。
解鎖即可觀看《大數(shù)據(jù)工程師》完整課程視頻
大數(shù)據(jù)工程師
硬核技能帶你攻克熱點商業(yè)項目,從入門直達中級工程師水平,掌握DT時代淘金利器!
【第1周】學好大數(shù)據(jù)先攻克Linux
【第2周】大數(shù)據(jù)起源之初識Hadoop
【第3周】Hadoop之HDFS的使用
【第4周】Hadoop之HDFS核心進程剖析
【第5周】Hadoop之初識MR
【第6周】拿來就用的企業(yè)級解決方案
【第7周】Flume從0到高手一站式養(yǎng)成記
【第8周】數(shù)據(jù)倉庫Hive從入門到小牛
【第9周】Hive擴展內(nèi)容
【第10周】快速上手NoSQL數(shù)據(jù)庫HBase
【第11周】數(shù)據(jù)分析引擎之Impala
【第12周】7天極速掌握Scala語言
【第13周】Spark快速上手
【第14周】Spark性能優(yōu)化的道與術
【第15周】Spark3.x擴展內(nèi)容
【第16周】綜合項目:電商數(shù)據(jù)倉庫之用戶行為數(shù)倉
【第17周】綜合項目:電商數(shù)據(jù)倉庫之商品訂單數(shù)倉
【第18周】消息隊列之Kafka從入門到小牛
【第19周】極速上手內(nèi)存數(shù)據(jù)庫Redis
【第20周】Flink快速上手篇
【第21周】Flink高級進階之路
【第22周】Flink1.15新特性及狀態(tài)的使用
【第23周】Flink1.15之狀態(tài)的容錯與一致性
【第24周】FlinkSQL(1.15)快速上手
【第25周】FlinkSQL雙流JOIN詳解
【第26周】全文檢索引擎Elasticsearch
【第27周】Es+HBase仿百度搜索引擎項目
【第28周】直播平臺三度關系推薦V1.0
【第29周】直播平臺三度關系推薦V2.0
【第30周】數(shù)據(jù)中臺大屏
【第31周】實時OLAP引擎之ClickHouse
【第32周】實時數(shù)倉-Kafka Eagle+DS
【第33周】實時數(shù)倉-Flink CDC數(shù)據(jù)采集
【第34周】實時數(shù)倉-Paimon(數(shù)據(jù)湖)快速上手
【第35周】實時數(shù)倉-Paimon(數(shù)據(jù)湖)高級進階
【第36周】實時數(shù)倉-湖倉一體項目
【第37周】一站式流式開發(fā)平臺StreamPark
【第38周】大數(shù)據(jù)分布式SQL網(wǎng)關Kyuubi