首頁 > 遊戲

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

由 方知資料 發表于 遊戲2023-01-01

簡介總共採集了拉勾網顯示的30頁450條資料,獲取到了公司名稱、規模、行業、融資階段、學歷要求、經驗要求及薪資待遇等欄位資訊

d輪及以上面試是什麼意思

本文使用Python採集了拉勾網北京站釋出的關於資料分析崗位的招聘資訊,並使用Python對資料進行了清洗和探索性分析。以下是資料的探索性分析結果。

以下是資料的探索性分析結果。

資料採集時間是在2022年5月1日上午,搜尋的關鍵詞是“資料分析”,篩選條件是把工作地點限定為北京。總共採集了拉勾網顯示的30頁450條資料,獲取到了公司名稱、規模、行業、融資階段、學歷要求、經驗要求及薪資待遇等欄位資訊。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

1.資料介紹

樣本中,學歷要求為本科的有409條,碩士23條,不限學歷的13條。本科學歷佔比達到了91%。可見,資料分析崗位對於人員的學歷要求相對還是比較高的。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

從經驗要求上來看,單位比較青睞有3-5年工作經驗的人才。要求有3-5年經驗的有160條,5-10年經驗的85條,1-3經驗年的81條,經驗不限的79條。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

工具技能方面是以職位標籤欄位為分析依據,透過是否包含英文字母為條件篩選出了211個樣本,其中包含“SQL”關鍵字的樣本136個,包含“PYTHON” 關鍵字的樣本97個,包含“BI”關鍵字的樣本11個,包含“EXCEL”關鍵字的樣本11個。可以看到,精通Python和SQL語言是拿到資料分析offer的有力敲門磚。EXCEL雖然上榜的次數很低,大概是因為作為最基礎的辦公技能而沒有在有限的職位標籤裡展示。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

2.資料分析崗位的應聘條件

全樣本的崗位平均薪資為24704元。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

從樣本數量上來看,比較有代表意義的是本科學歷的工資。招聘資訊中本科學歷的平均薪資為24711元,中位數是22500,最大值是65000。中位數小於平均數,說明平均值以上的人是少於平均值以下的人。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

學歷為不限的樣本一共有13個。釋出招聘學歷條件為不限的企業有亞創、汽車之家、位元組跳動、美團、轉轉、陌陌、易車公司、崑崙數智、神策資料、知乎10家公司。其中工資最高的招聘資訊是由易車公司釋出的。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

以經驗要求為分組依據,統計各分組下的薪資水平。總體來看,經驗與薪資水平正相關。應屆生的平均薪資為7637元。比較異常的是,經驗條件為不限的崗位薪酬要比

1-3年

經驗的薪酬高。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

以下是把經驗要求和學歷門檻兩個欄位同時作為分組依據對薪資待遇進行統計的結果。可以看出,學歷為本科或碩士且經驗在5-10年的薪資是最高的。學歷為不限的招聘資訊中,有3-5年經驗要求的薪資最高。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

3.學歷、經驗與薪資水平的關係

招聘資訊顯示公司當前的融資狀態分為不需要融資、未融資、天使輪、A輪、B輪、C輪、D輪及以上、上市公司。招聘資料分析師的公司大多都處於上市或不需要融資階段,該類公司釋出的招聘資訊條數佔比約77%。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

從融資階段與薪資水平的關係來看,D輪及以上的公司薪資待遇最好,上市公司和C輪融資的公司次之。其他融資階段的公司薪資水平相差不大,不要融資的公司與最低水平的B輪融資公司平均薪資僅相差778元。

4.融資狀態與薪資水平的關係

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

接下來以融資階段和學歷門檻作為交叉分組依據,統計不同組別下的平均薪資。結果顯示,本科學歷在不同融資階段公司的薪酬排名與上文全樣本的統計結果一致。不同的是,碩士學歷薪資待遇最好的是在C輪融資公司,其次是D輪及以上的公司。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

以下是招聘資訊中公司的規模資訊出現的次數分佈。可以看出,資料分析師的崗位多集中在500人以上的大公司。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

以下是不同規模的公司下資料分析崗位平均薪資的分佈情況。總體來看,資料分析師的薪資待遇是與公司規模正相關的。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

由於把本科作為學歷門檻的樣本佔比最高,這裡觀察了本科學歷下 不同規模的企業開出的薪資水平。結果顯示,結論與前文一致,對於本科生來說,薪資待遇也是與企業規模成正比的。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

5.公司規模與薪資水平的關係

以下是對行業欄位的資料進行的詞頻統計。結果顯示,出現的頻率最高的詞彙是“諮詢”,出現的頻數為120。其次是內容諮詢、短影片和資料服務。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

下面統計的是不同型別的公司釋出的資訊數量。可以看出,諮詢服務類的公司釋出的招聘資訊是最多的。其次是內容資訊行業和金融行業,電商、居住和出行

業的招聘資訊數量比較接近。此外,服務行業的公司主要型別有IT技術服務、資料服務、人工智慧服務和居住服務。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

下面對高頻出現的行業的平均薪資做了統計分析。可以看出,出行行業的平均薪資最高,大約是34333元。其次是電商行業,平均薪資為27146元。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

6.行業分佈及其與薪資水平的關係

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

7.工作地點分佈

以下是樣本數量隨釋出時間變化的統計分析。可以看到,職位釋出的時間主要集中在4。24-3。30日,釋出的資訊數量最多的一天是在4月29日。

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

8.招聘資訊釋出時間

(1)總體來看,資料分析職位的最低學歷門檻為本科,具有3-5年經驗的人才更受公司青睞,掌握Python 和 SQL 語言的人面試該崗位更具有競爭力。全樣本的崗位平均薪資為24704元,限定學歷為本科的樣本平均薪資為24711元。應聘者的學歷、經驗與薪資水平正相關。公司的規模與與薪資水平正相關。具有5-10年經驗的本科或碩士生的薪資最高。

(2)從融資階段來看,招聘資料分析師的公司大多都已上市或處於不需要融資的階段。薪酬待遇排名較高的依次是D 輪及以上的公司28957元、上市公司26388元和 C輪融資公司24435元。其他融資階段的公司薪資水平相差不到1000元,平均為21470元。本科學歷的薪酬待遇最好的地方是在D 輪及以上的公司,碩士學歷薪資待遇最好的是在 C 輪融資公司。

(3)從公司規模來看,資料分析師的崗位多集中在 500 人以上的大公司。總體來看,資料分析師的薪資待遇是與公司規模正相關的。

(4)從公司所屬行業來看,資料分析師的崗位主要集中在諮詢服務類的公司,其次是在內容資訊行業和金融行業,最後是電商、居住和出行行業。其中,服務行業的公司主要型別有 IT 技術服務、資料服務、人工智慧服務和居住服務。出行行業的平均薪資最高,大約是34333 元。其次是電商行業,平均薪資為 27146 元。

9.主要結論

使用Python爬取拉勾網的資料分析師崗位資料並進行視覺化分析

Tags:薪資學歷公司樣本融資