- 目錄
第1篇 hadoop sre工程師職位描述與崗位職責(zé)任職要求
職位描述:
工作職責(zé):
1、參與打造業(yè)界領(lǐng)先的存儲(chǔ)、計(jì)算、消息隊(duì)列等分布式系統(tǒng)
2、為海量數(shù)據(jù)及其上的大規(guī)模數(shù)據(jù)挖掘、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)業(yè)務(wù)系統(tǒng)提供可靠、高效的支持
3、深入了解業(yè)務(wù)需求,利用存儲(chǔ)技術(shù)支持關(guān)鍵業(yè)務(wù)場(chǎng)景
任職要求:
1、掌握分布式系統(tǒng)原理,對(duì)存儲(chǔ)、計(jì)算、消息隊(duì)列的一項(xiàng)或多項(xiàng)有深入的理解和認(rèn)識(shí)
2、樂于挑戰(zhàn)沒有明顯答案的問題,能快速理解業(yè)務(wù)場(chǎng)景,從具體問題中抽象出通用的解決方案
3、有較好的溝通能力;有良好的團(tuán)隊(duì)合作精神
第2篇 直播cdn/實(shí)時(shí)通信sre工程師職位描述與崗位職責(zé)任職要求
職位描述:
工作職責(zé):
1、負(fù)責(zé)直播cdn/實(shí)時(shí)通信的系統(tǒng)高可用架構(gòu)和規(guī)劃,包括但不限于全鏈路壓測(cè)、故障診斷、故障容災(zāi)、智能調(diào)度、彈性擴(kuò)容與防攻擊
2、設(shè)計(jì)并實(shí)現(xiàn)能夠保障線上大規(guī)模集群的迭代、自動(dòng)化運(yùn)維平臺(tái)
3、全球化流媒體傳輸網(wǎng)絡(luò)建設(shè)與調(diào)優(yōu)
4、設(shè)計(jì)優(yōu)化的qos數(shù)據(jù)上報(bào)機(jī)制,大數(shù)據(jù)pipeline,監(jiān)控,分析和報(bào)表系統(tǒng),不間斷監(jiān)測(cè)用戶體驗(yàn)
任職要求:
1、有大型系統(tǒng)的運(yùn)維管理經(jīng)驗(yàn),對(duì)立體監(jiān)控、自動(dòng)部署、容量管理、自動(dòng)容災(zāi)有較深入的理解和實(shí)踐經(jīng)驗(yàn)
2、熟悉linu_操作系統(tǒng)、tcp/ip等常用協(xié)議,熟悉cdn & dns 基本原理,了解ngin_/lvs/puppet/ansible/zabbi_/falcon等開源軟件(至少2種)
3、熟悉全鏈路壓測(cè)、降級(jí)、流控、熔斷等穩(wěn)定性保障手段
4、有日志處理及分析相關(guān)經(jīng)驗(yàn),熟悉相關(guān)的組件者優(yōu)先,如:kafka,elk,flink,storm,flume等
5、有監(jiān)控系統(tǒng)構(gòu)建研發(fā)經(jīng)驗(yàn)優(yōu)先
第3篇 推薦架構(gòu)sre工程師-抖音/火山職位描述與崗位職責(zé)任職要求
職位描述:
工作職責(zé):
1、負(fù)責(zé)抖音、火山等海內(nèi)外億級(jí)產(chǎn)品的大規(guī)模集群的sre和運(yùn)維優(yōu)化工作
2、負(fù)責(zé)核心服務(wù)的持續(xù)集成和交付,高效和自動(dòng)化的運(yùn)維優(yōu)化,提升服務(wù)的穩(wěn)定性和研發(fā)效率
3、負(fù)責(zé)大規(guī)模集群的云平臺(tái)化、資源優(yōu)化、sla保障。
任職要求:
1、大規(guī)模系統(tǒng)的sre或運(yùn)維經(jīng)驗(yàn),熟悉linu_、網(wǎng)絡(luò)等系統(tǒng)運(yùn)維的技能;
2、對(duì)大規(guī)模分布式系統(tǒng)的設(shè)計(jì),分析,故障排查有強(qiáng)烈興趣
3、開發(fā)語言python/shell;
4、有以下經(jīng)驗(yàn)者優(yōu)先:云平臺(tái)相關(guān)經(jīng)驗(yàn)(阿里云、aws等)。
第4篇 aml機(jī)器學(xué)習(xí)平臺(tái)sre工程師職位描述與崗位職責(zé)任職要求
職位描述:
工作職責(zé):
1、aml: applied machine learning
2、設(shè)計(jì)和搭建高可靠的機(jī)器學(xué)習(xí)系統(tǒng)
3、負(fù)責(zé)機(jī)器學(xué)習(xí)服務(wù)各環(huán)節(jié) (樣本生成,樣本管理,模型訓(xùn)練,模型服務(wù),實(shí)時(shí)更新)的穩(wěn)定運(yùn)轉(zhuǎn)
4、硬件資源的管理與規(guī)劃
任職要求:
1、扎實(shí)的編程基礎(chǔ),熟練掌握 c/c++, python,uni_ shell
2、有大型分布式軟件 (如spark, yarn和tensorflow等) 的資源管理和任務(wù)調(diào)度經(jīng)驗(yàn)
3、熟悉操作系統(tǒng)和計(jì)算機(jī)體系結(jié)構(gòu)
加分項(xiàng):
1、熟悉至少一種主流深度學(xué)習(xí)編程框架(tensorflow/caffe/m_net),熟悉其底層架構(gòu)和實(shí)現(xiàn)機(jī)制
2、有過開源社區(qū)經(jīng)歷
第5篇 高級(jí)sre工程師崗位職責(zé)任職要求
高級(jí)sre工程師崗位職責(zé)
工作職責(zé):
1、建設(shè)網(wǎng)絡(luò)評(píng)估體系;
2、全球化產(chǎn)品的網(wǎng)絡(luò)調(diào)優(yōu)、故障排除等;
任職要求:
1、有海量用戶的產(chǎn)品開發(fā)運(yùn)維經(jīng)驗(yàn),對(duì)網(wǎng)絡(luò)劫持、故障有能力迅速定位并解決;
2、熟悉tcp/ip、http、http協(xié)議,了解http2、quic等協(xié)議;
3、熟悉linu_環(huán)境,熟悉socket編程,熟悉c++/python/golang之一;
4、熟悉網(wǎng)絡(luò)交換/路由原理;
5、對(duì)用戶體驗(yàn)有極致的追求,有用戶至上的強(qiáng)烈熱情;
6、有過海外2c產(chǎn)品運(yùn)維和開發(fā)經(jīng)驗(yàn)者優(yōu)先;
7、可以接受偶爾短期國(guó)外出差。
第6篇 sre工程師-抖音/火山職位描述與崗位職責(zé)任職要求
職位描述:
工作職責(zé):
1、負(fù)責(zé)抖音、火山等海內(nèi)外億級(jí)產(chǎn)品的大規(guī)模集群的sre和運(yùn)維優(yōu)化工作
2、負(fù)責(zé)核心服務(wù)的持續(xù)集成和交付,高效和自動(dòng)化的運(yùn)維優(yōu)化,提升服務(wù)的穩(wěn)定性和研發(fā)效率
3、負(fù)責(zé)大規(guī)模集群的云平臺(tái)化、資源優(yōu)化、sla保障。
任職要求:
1、大規(guī)模系統(tǒng)的sre或運(yùn)維經(jīng)驗(yàn),熟悉linu_、網(wǎng)絡(luò)等系統(tǒng)運(yùn)維的技能;
2、對(duì)大規(guī)模分布式系統(tǒng)的設(shè)計(jì),分析,故障排查有強(qiáng)烈興趣
3、開發(fā)語言python/shell;
4、有以下經(jīng)驗(yàn)者優(yōu)先:云平臺(tái)相關(guān)經(jīng)驗(yàn)(阿里云、aws等)
第7篇 高級(jí)網(wǎng)絡(luò)sre工程師職位描述與崗位職責(zé)任職要求
職位描述:
工作職責(zé):
1、建設(shè)網(wǎng)絡(luò)評(píng)估體系;
2、全球化產(chǎn)品的網(wǎng)絡(luò)調(diào)優(yōu)、故障排除等;
任職要求:
1、有海量用戶的產(chǎn)品開發(fā)運(yùn)維經(jīng)驗(yàn),對(duì)網(wǎng)絡(luò)劫持、故障有能力迅速定位并解決;
2、熟悉tcp/ip、http、http協(xié)議,了解http2、quic等協(xié)議;
3、熟悉linu_環(huán)境,熟悉socket編程,熟悉c++/python/golang之一;
4、熟悉網(wǎng)絡(luò)交換/路由原理;
5、對(duì)用戶體驗(yàn)有極致的追求,有用戶至上的強(qiáng)烈熱情;
6、有過海外2c產(chǎn)品運(yùn)維和開發(fā)經(jīng)驗(yàn)者優(yōu)先;
7、可以接受偶爾短期國(guó)外出差。