首頁 > 運動

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

由 資料分析不是個事兒 發表于 運動2021-11-26

簡介這一模組主要掌握隨機事件的機率離散隨機變數連續隨機變數的機率分佈二、資料的概括性度量在資料人的實際工作中,你會經常遇到這種情況:業務人員老闆拿到一坨資料,丟在你面前,讓你分析

為什麼要做迴歸分析

每次在寫資料分析必學知識時,我都會提到,對於資料分析師來說,我們是必須學習統計學知識的,畢竟天天跟資料打交道,總不能連最基礎的統計學知識都不會吧?

舉個例子,資料分析,

你如果連最起碼的置信區間都不懂,你還怎麼處理資料?

如果

統計學中最基本、核心的思想:用樣本估計總體,你都沒概念,就別說自己會資料分析了。

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

但多數人在學習統計學知識時會無比頭疼,因為統計學的書籍裡幾乎都是複雜的推理公式,讓人難以理解。其實,對於大部分資料分析師來說,我們並不需要掌握的那麼細。

因此,我整理了一些你需要掌握的統計學知識,把統計學知識展開了說,讓大家大致瞭解有哪幾個模組知識,然後跟著這些模組知識去學習。

一、機率與機率分佈

先要明確,統計學不研究統計,它研究的是不確定性!

而不確定性事件唯一的量化標準就是機率,獨立隨機事件沒法透過機率來預判何時發生,但卻可以用機率來描述事件發生的可能性。

這一模組主要掌握

隨機事件的機率

離散隨機變數

連續隨機變數的機率分佈

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

二、資料的概括性度量

在資料人的實際工作中,你會經常遇到這種情況:業務人員/老闆拿到一坨資料,丟在你面前,讓你分析。這時,大多數人會不知所措,不知道從哪一步開始整理這些資料。這個時候,就需要透過概括性的度量指標,來幫我們從宏觀上把握資料中的初步資訊。

這一模組主要掌握

集中趨勢的度量

離散程度的度量

分佈形態的度量

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

三、迴歸分析

迴歸分析,因為它的易懂性,也因為它的實用性,但隨著自己資料分析經驗的積累,對迴歸分析的理解也越來越深,它不是簡單的迴歸模型求解那麼簡單,它更是一種日常工作中解決問題的思路和方法論。

這一模組主要掌握

相關係數

迴歸分析

最小二乘法

顯著性檢驗

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

四、統計量及其抽樣分佈

抽樣,就是從研究的總體中抽取一部分個體作為我們真正的研究物件,稱為樣本,最後透過樣本的結果來推測總體情況。

這一模組主要掌握

統計量的基本概念

常用統計量

正態分佈

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

五、引數估計

引數估計,顧名思義就是對引數進行估計,那什麼是引數呢?就是你假設分佈的引數,也就是說你知道某個隨機過程服從什麼分佈,但是不確定他的引數是什麼,那怎麼辦?你取樣,然後透過這些樣本的值,去估計分佈的引數就是引數估計。

這一章節,需要大家掌握幾個核心概念:

引數

點估計

區間估計

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

我是“資料分析不是個事兒”,常年分享資料分析乾貨,不定期分享好用的職場技能工具,對資料分析感興趣的話,可以點個關注。

學資料分析究竟要懂哪些統計學?全都給你梳理好了,拿走不謝

Tags:統計學資料分析模組知識度量