400-650-7353

2019年最新买马资料全

您所在的位置:首頁 > IT就業指南 > 面試題 > 【大數據面試題】常見的大數據面試題(二)

2019年12生肖数字图:【大數據面試題】常見的大數據面試題(二)

2019年最新买马资料全 www.wwmlw.icu 大數據時代,許多工作都要依靠海量的數據,尤其是IT行業,那么做大數據工程師需要掌握哪些呢?以下就是一些大數據面試題

【大數據面試題】常見的大數據面試題(二)

1、怎么解決kafka的數據丟失

2、fsimage和edit的區別?

3、列舉幾個配置文件優化?

4、datanode 首次加入 cluster 的時候,如果 log 報告不兼容文件版本,那需要namenode 執行格式化操作,這樣處理的原因是?

5、MapReduce 中排序發生在哪幾個階段?這些排序是否可以避免?為什么?

6、hadoop的優化?

7、采集nginx產生的日志,日志的格式為user ip time url htmlId 每天產生的文件的數據量上億條,請設計方案把數據保存到HDFS上,并提供一下實時查詢的功能(響應時間小于3s)

8、有 10 個文件,每個文件 1G,每個文件的每一行存放的都是用戶的 query,每個文件的query 都可能重復。要求你按照 query 的頻度排序。 還是典型的 TOP K 算法,

9、在 2.5 億個整數中找出不重復的整數,注,內存不足以容納這 2.5 億個整數。

10、騰訊面試題:給 40 億個不重復的 unsigned int 的整數,沒排過序的,然后再給一個數,如何快速判斷這個數是否在那 40 億個數當中?

相關推薦:

【優就業大數據培訓】從小白到大咖 打造大數據精英人才

【大數據培訓教程】把握時代風口,做大數據架構師

>>本文地址:
注:本站稿件未經許可不得轉載,轉載請保留出處及源文件地址。

申請免費試聽課程
課程干貨資料
 

相關推薦

從入門到進階
免費干貨資料

進群即領(備注“500G”)
進群即領
(備注“500G”)
 
 
斗牛看四张牌抢庄技巧 广东11选五计划软件苹果下载 比例投注法是怎么投的 pk10赛车计划数据 开个手机店要多少钱 资金盘不让提现了怎么办 重庆市彩走势图彩经网 幸运飞艇彩票计划软件下载 美女捕鱼游戏手机版 双色球胆拖表 天天棋牌斗地主现金版 pk10免费走势图app分析 6个号三中三 快速时时的套路 看飞艇计划 黑龙江时时乐乐