ETL工程師又叫數(shù)據(jù)庫工程師。
ETL工程師的主要工作內(nèi)容有:從事系統(tǒng)編程、數(shù)據(jù)庫編程與設(shè)計(jì)。
ETL原本是作為構(gòu)建數(shù)據(jù)倉庫的一個(gè)環(huán)節(jié),負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。因?yàn)橐郧敖?jīng)常是將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)取出來放到數(shù)倉中,按照星型或雪花型建模。
etl工程師累呀
ETL工程師做的是一些偏底層的臟活累活,不容易體現(xiàn)價(jià)值,一般3~5年后就會達(dá)到職業(yè)瓶頸。
程序員的工作確實(shí)很枯燥,也很累,不過收入尚可,如果你不是天才級別的程序員,沒有什么其他的出路。
在中國頂尖的互聯(lián)網(wǎng)公司里,ETL工程師的薪酬也比同級別的其他職位高出30%以上。
1、銀行證券業(yè)務(wù)調(diào)研、需求分析與設(shè)計(jì)、數(shù)據(jù)分析;
2、負(fù)責(zé)ETL開發(fā),獨(dú)立完成ETL詳細(xì)設(shè)計(jì)與開發(fā)測試工作;
3、參與數(shù)據(jù)倉庫系統(tǒng)上線及運(yùn)維工作。
任職要求:
1、計(jì)算機(jī)相關(guān)專業(yè),統(tǒng)招本科以上學(xué)歷;
2、熟悉數(shù)據(jù)倉庫建設(shè)流程、具備數(shù)據(jù)倉庫、模型設(shè)計(jì)經(jīng)驗(yàn)、ETL開發(fā)實(shí)施經(jīng)驗(yàn);
3、精通SQL、存儲過程等開發(fā),有SQL調(diào)優(yōu)知識和經(jīng)驗(yàn),掌握Greenplum、Oracle、Sqlserver、Teradata、DB2、MySQL等一種或多種數(shù)據(jù)庫系統(tǒng)的使用;
4、熟悉Linux操作系統(tǒng)、熟練使用linux常用命令;
5、具有Kettle、Informatica、DataStage、PowerCenter等ETL開發(fā)工具的實(shí)施經(jīng)驗(yàn);
6、熟練使用Perl、Shell、Java、Python腳本進(jìn)行開發(fā);
7、熟悉Hadoop、Hive,Hbase,Kafka,Spark,Storm等大數(shù)據(jù)技術(shù)優(yōu)先;
8、有銀行/保險(xiǎn)/證券等金融業(yè)數(shù)據(jù)倉庫經(jīng)驗(yàn)優(yōu)先。
從事系統(tǒng)編程、數(shù)據(jù)庫編程與設(shè)計(jì)。
1.ETL中三個(gè)字母分別代表的是Extract、Transform、Load,即抽取、轉(zhuǎn)化、加載。 ETL工程師又叫數(shù)據(jù)庫工程師主要工作內(nèi)容有:從事系統(tǒng)編程、數(shù)據(jù)庫編程與設(shè)計(jì)。
2.ETL是作為構(gòu)建數(shù)據(jù)倉庫的一個(gè)環(huán)節(jié),負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。因?yàn)橐郧敖?jīng)常是將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)取出來放到數(shù)倉中,按照星型或雪花型建模。
隨著大數(shù)據(jù)技術(shù)的發(fā)展和普及,ETL工程師的職業(yè)前景是相當(dāng)廣闊的。數(shù)據(jù)管道構(gòu)建與管理已成為企業(yè)數(shù)據(jù)處理和分析的重要組成部分,而ETL工程師既可以通過自己編寫腳本等技術(shù)手段進(jìn)行數(shù)據(jù)處理,又能夠了解數(shù)據(jù)流的各個(gè)處理階段,從而積累對大數(shù)據(jù)的深入了解。因此,ETL工程師的職業(yè)前景在今后將會越來越好,成為后續(xù)大數(shù)據(jù)相關(guān)職位的重要補(bǔ)充。
商務(wù)智能。商務(wù)智能工程師是商業(yè)智能行業(yè)的工程師。從需求分析師到數(shù)據(jù)倉庫架構(gòu)師、ETL工程師、數(shù)據(jù)分析工程師、報(bào)表開發(fā)工程師、數(shù)據(jù)挖掘工程師等,都可以稱為BI工程師。
ETL工程師:從事系統(tǒng)編程、數(shù)據(jù)庫編程和設(shè)計(jì),掌握各種常用編程語言的專業(yè)技術(shù)人員。也稱為數(shù)據(jù)庫工程師。
數(shù)倉工程師(Warehouse Engineer)和ETL工程師(Extract, Transform, Load Engineer)都是在數(shù)據(jù)倉庫和大數(shù)據(jù)處理領(lǐng)域工作的專業(yè)人士。盡管它們的職責(zé)有一定的重疊,但它們在技能和專長方面有一些區(qū)別:
1. 數(shù)倉工程師:數(shù)倉工程師主要負(fù)責(zé)構(gòu)建、管理和維護(hù)數(shù)據(jù)倉庫。他們需要確保數(shù)據(jù)的質(zhì)量、完整性和一致性。此外,他們還需要設(shè)計(jì)和優(yōu)化數(shù)據(jù)架構(gòu),以滿足業(yè)務(wù)需求。數(shù)倉工程師通常需要具備數(shù)據(jù)倉庫理論、數(shù)據(jù)建模和ETL工具(如Talend、Informatica、Microsoft SQL Server Integration Services等)的使用經(jīng)驗(yàn)。
2. ETL工程師:ETL工程師的主要任務(wù)是將數(shù)據(jù)從不同的數(shù)據(jù)源提?。‥xtract),經(jīng)過轉(zhuǎn)換(Transform),然后將處理后的數(shù)據(jù)加載(Load)到數(shù)據(jù)倉庫或其他目標(biāo)存儲中。ETL工程師需要了解各種數(shù)據(jù)源和數(shù)據(jù)格式,具備使用ETL工具(如Talend、Informatica、Microsoft SQL Server Integration Services等)的技能。他們通常需要與數(shù)據(jù)工程師、業(yè)務(wù)分析師和數(shù)據(jù)科學(xué)家密切合作,以確保數(shù)據(jù)的有效整合和分析。
數(shù)倉工程師關(guān)注數(shù)據(jù)倉庫的設(shè)計(jì)和管理,而ETL工程師關(guān)注數(shù)據(jù)的抽取、轉(zhuǎn)換和加載。盡管兩者的職責(zé)有一定的重疊,但它們在技能和專長方面有所區(qū)別。在實(shí)際工作中,這兩類工程師可能會共同協(xié)作,共同完成數(shù)據(jù)倉庫的建設(shè)和維護(hù)任務(wù)。
bi工程師通常要會etl。
ETL是 抽取、轉(zhuǎn)換、加載這三個(gè)單詞的縮寫,所以顧名思義主要的一個(gè)工作就是把數(shù)據(jù)從哪塊兒抽過來,然后進(jìn)行一個(gè)清洗、加工,最后再存到哪塊兒。
ETL的工作主要是對數(shù)倉的底層建設(shè), ETL這個(gè)崗位我覺得是非常重要的,因?yàn)樗鼘儆谑且粋€(gè)基礎(chǔ),如果ETL工作做好的話會有事半功倍的效果。
BI的主要的工作點(diǎn)應(yīng)該是在于后期的展示。比如說報(bào)表、分析,這種出圖、出結(jié)果等工作,可能更面向于應(yīng)用這方面。
1.
大數(shù)據(jù)。
做etl工程師,關(guān)鍵要學(xué)習(xí)大數(shù)據(jù),這樣以后的就業(yè)前景就會十分廣闊。
2.
學(xué)習(xí)數(shù)據(jù)抽取。
要從數(shù)據(jù)源學(xué)起,要學(xué)會如何定義數(shù)據(jù)接口,以及數(shù)據(jù)抽取的方法。
3.
學(xué)習(xí)數(shù)據(jù)轉(zhuǎn)換。
這一塊的知識是非常多的,包括數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)拆分、數(shù)據(jù)驗(yàn)證、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)替換等,每一部分都包含相應(yīng)的內(nèi)容,以數(shù)據(jù)標(biāo)準(zhǔn)為例,要學(xué)習(xí)統(tǒng)一元數(shù)據(jù)、統(tǒng)一標(biāo)準(zhǔn)字段等。
4.
學(xué)習(xí)數(shù)據(jù)加載。
這個(gè)階段的學(xué)習(xí),主要目標(biāo)就是將處理好的數(shù)據(jù)再編寫,如寫成csv格式、parquet格式等,簡單來說,就是將數(shù)據(jù)加載到“目的地”。
ETL工程師是負(fù)責(zé)數(shù)據(jù)提取、轉(zhuǎn)換和加載的工程師,他們工作內(nèi)容主要是負(fù)責(zé)設(shè)計(jì)和開發(fā)數(shù)據(jù)轉(zhuǎn)換和清洗流程,以及維護(hù)數(shù)據(jù)質(zhì)量。ETL工程師需要具備數(shù)據(jù)集成、數(shù)據(jù)質(zhì)量、數(shù)據(jù)規(guī)范化和標(biāo)準(zhǔn)化、數(shù)據(jù)安全、數(shù)據(jù)治理等方面的知識和技能。
ETL工程師需要考試的證書包括專業(yè)技術(shù)資格證書,又稱職稱證書。這些證書可以證明他們在數(shù)據(jù)集成、數(shù)據(jù)質(zhì)量、數(shù)據(jù)規(guī)范化和標(biāo)準(zhǔn)化、數(shù)據(jù)安全、數(shù)據(jù)治理等方面的專業(yè)能力和水平。
除了證書,ETL工程師還需要掌握以下技能:
熟練掌握數(shù)據(jù)集成、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載的技能。
熟練掌握數(shù)據(jù)庫知識和數(shù)據(jù)庫操作技能,如SQL、Oracle、MySQL等。
熟練掌握數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)和數(shù)據(jù)規(guī)范,能夠進(jìn)行數(shù)據(jù)規(guī)范化和標(biāo)準(zhǔn)化。
熟練掌握數(shù)據(jù)安全和數(shù)據(jù)治理的相關(guān)知識和技能,能夠保證數(shù)據(jù)的安全性和保密性。
具備良好的編程能力和代碼規(guī)范,能夠編寫高質(zhì)量的代碼。
具備良好的溝通和團(tuán)隊(duì)合作能力,能夠與其他部門和團(tuán)隊(duì)進(jìn)行有效的協(xié)作和溝通。
總之,ETL工程師需要具備多方面的技能和知識,包括技術(shù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全和團(tuán)隊(duì)合作等方面。