免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
8000 星!GitHub 高贊機器學習路線圖,有人把它翻譯成了中文版!

重磅干貨,第一時間送達

來源 | 大數(shù)據(jù)文摘

編輯 | 紅色石頭

試圖入門機器學習時,多數(shù)人會感到不知所措?這時候,一份明確的學習路徑可以幫你去除這一焦慮。

一周前在Github上出現(xiàn)的一份超高贊貼就總結(jié)出了這樣一份“入門套路”,據(jù)這位神秘的發(fā)帖人所說,機器學習不需要繁雜的準備和高深的數(shù)學知識,你只需有足夠的時間、正確的學習方法、對數(shù)據(jù)分析的好奇心就足夠了。

原項目

其實,前段時間紅色石頭就發(fā)文推薦過這個 GitHub 高贊項目,鏈接如下:

5000 星!GitHub 高贊機器學習路線圖,請務必收藏!

這個項目是一位名為“維吉爾(Vigilio)”的開發(fā)者整理的。項目包括職業(yè)進階路徑、專業(yè)知識講解、工具介紹等,著重強調(diào),不走彎路,簡明扼要!Vigilio稱,這篇帖子按照層次結(jié)構(gòu)和復雜程度組織編寫,以便讓學習者對事物的運作方式有一個連貫的想法。

項目地址:

https://github.com/clone95/Virgilio

該項目主要包含了六個方面:

  • New To Data Science?

  • Complete Learning Paths

  • Specializations

  • Tools

  • Topics

  • Research

我們通過一張圖來看一下這個項目包含了哪些內(nèi)容。

這份學習路線圖可以說非常完整和詳細,包含的內(nèi)容很全面。但是缺點就是英文版不方便大家閱讀,以便更有效率地學習。

漢化項目

重點來了!就在一周前,這份英文版 GitHub 資料被名為 @jiaxianhua 的同胞翻譯出了簡體中文版,讓不想費力讀英文的同學也可以輕松上手啦!

當然,先附上網(wǎng)址:??

https://github.com/clone95/Virgilio/tree/master/zh-CN

下面文摘菌根據(jù)這份資料給大家好好捋一捋這個漢化項目的具體內(nèi)容。

1. 新接觸數(shù)據(jù)科學?

新接觸數(shù)據(jù)科學需要什么?當然,Python 這一基礎的編程語言需要掌握。一些數(shù)學的基礎知識當然也少不了。如果想進階的話,當然就需要學習一些高等的數(shù)學知識和高級的Python啦。

在這份 GitHub 項目里,這位外國小哥給出了基礎 Python 教程以及數(shù)據(jù)科學 Python 教程。其他的部分,包括高級 Python、高等數(shù)學以及數(shù)學科學里的數(shù)學知識,目前都還是“即將推出”的狀態(tài)。

先學 Python 然后入門數(shù)據(jù)科學,這絕對是最高效的學習路徑。

在基礎 Python 目錄下,先給出超鏈接讓你學習基本算術(shù)運算和數(shù)據(jù)類型,然后介紹流程控制,包括if語句的使用,for 循環(huán)的使用等等。 

關(guān)于函數(shù)的使用,在項目中,作者也給出了一個好的經(jīng)驗法則是:如果一件事情要重復做 3 次以上,那就寫一個函數(shù)吧,并根據(jù)你的需要決定調(diào)用次數(shù)。

除此之外,一些基礎知識也有介紹。包括如何定義函數(shù),如何調(diào)用等等。

總之,資料非常豐富,對于一些問題講的不夠清楚的地方也給出了超鏈接轉(zhuǎn)到了相應的答案。

2. 完整的學習路徑

一個專業(yè)的機器學習工程師應該專注于 TensorFlow 和 Scikit-Learn。而使用 Scikit-Learn 主要能做的是端到端機器學習項目、線性回歸、分類、訓練模型、支持向量機、決策樹、集成學習和隨機森林以及無監(jiān)督學習。

使用 TensorFlow 能夠搭建:ANN - 人工神經(jīng)網(wǎng)絡,CNN - 卷積神經(jīng)網(wǎng)絡,RNN - 遞歸神經(jīng)網(wǎng)絡以及自動編碼器和做強化學習相關(guān)的項目。

除了使用這兩個框架之外,一些文章,網(wǎng)絡應用程序,reddit 線程,最佳實踐,項目和 repo 也非常值的看。

數(shù)據(jù)科學備忘單

https://github.com/FavioVazquez/ds-cheatsheets

真實數(shù)據(jù)科學/ML 項目的集合

https://docs.google.com/document/d/e/2PACX-1vRRC3ZIcvjFqEYEgnN9pptoWONr2mSGZJ4hSdL8Jpf2IpXdxjTc-d3jrpb98h59xJnZ3h1frUDydoxc/pub

TensorFlow中的教程和 ML 項目的集合

https://github.com/jtoy/awesome-tensorflow

其他 TensorFlow示例

https://github.com/aymericdamien/TensorFlow-Examples

更多需要收藏以及注意的文章,博客可以去這份資料中尋找:

地址:

https://github.com/clone95/Virgilio/tree/master/zh-CN/LearningPaths/Machine%20Learning%20Engineer%20Career%20Path

在學習機器學習時,數(shù)學知識應該掌握到什么程度?正如這份github的作者而言:

無論誰告訴你機器學習背后的數(shù)學很難...... 都沒有錯!但是你必須考慮到每次你要使用它時,機器都會為你處理它!因此,重要的是掌握主要概念并認識到這些概念的限制和應用。沒有人會要求你手工計算梯度!

注:在路徑這一塊,目前只有機器學習相關(guān)資料,商業(yè)智能和云計算都是待推出狀態(tài)

3. 專業(yè)化

這個類別中,目前存在的是數(shù)據(jù)預處理和有效陳述這兩個項目。同樣,其他的項目包括數(shù)據(jù)可視化、數(shù)據(jù)采集等都是待推出的狀態(tài)。

關(guān)于數(shù)據(jù)預處理,其實是個迭代過程的收集、組合、結(jié)構(gòu)化和組織數(shù)據(jù)。目的是為以后的數(shù)據(jù)可視化,分析和機器學習打下堅實的基礎。

每一個數(shù)據(jù)科學家或者數(shù)據(jù)工程師都應該具有清洗和構(gòu)造數(shù)據(jù)的能力。不同的數(shù)據(jù)類型,需要做出不同的數(shù)據(jù)處理。在做數(shù)據(jù)預處理的過程中最主要是有不要把數(shù)據(jù)當玩笑的心態(tài)。

首先在嘗試數(shù)據(jù)準備步驟時,先不要處理 GB 級別的數(shù)據(jù)。只需使用數(shù)據(jù)的小子集 ,但子集要具有代表性)

在做數(shù)據(jù)清洗工作時候,需要注意:刪除額外的空格、選擇并處理所有空白單元格、轉(zhuǎn)換值類型、刪除重復項、將文本更改為小寫 / 大寫、拼寫檢查、處理特殊字符、規(guī)范日期、驗證豐富數(shù)據(jù)、數(shù)據(jù)離散化、特征縮放等等。數(shù)據(jù)預處理是非常復雜的,你的最終目標是做到盡可能 自動化。 

然后在數(shù)據(jù)分析中需要明確:你打算解決哪個業(yè)務問題 (什么是重要的,什么不是);數(shù)據(jù)是如何被收集的(有噪音,缺失值......) ;你們有多少數(shù)據(jù)在那里,我在哪里可以找到他們? (數(shù)據(jù)維度和從存儲中檢索)。

在學習數(shù)據(jù)預處理的過程中,你可以按順序選擇它們或選擇最適合你的那個,但建議你至少要一次把它們都看完。

總體來說有兩種類型的專業(yè)化:硬技能和軟技能。

前者是關(guān)于技術(shù)流程,是每個處理數(shù)據(jù)的人的核心工具包。使用數(shù)據(jù)是一種藝術(shù)形式,經(jīng)驗法則和最佳實踐將幫助你了解處理它們的方式。你需要對如何處理數(shù)據(jù)產(chǎn)生一種 “感覺”,這種 “感覺” 主要是由情況和經(jīng)驗驅(qū)動的。

后者是真正的價值促成者。如果有了軟技能,你可以成為世界上最好的開發(fā)人員或工程師,但如果你無法向受眾傳達你的建議和發(fā)現(xiàn),或者使用數(shù)據(jù)來建議企業(yè)如何做決策,那么你對公司來說就毫無用處。

在向受眾傳達建議和發(fā)現(xiàn)時,需要的框架包括:設置、故事、情緒和感覺(你需要在你的受眾中重現(xiàn)它們)、結(jié)論的動機以及結(jié)論。

在說話時候注意使用第一個人,注意修辭問題,表達盡可能的自然,最后給出總結(jié)理由和實際建議。

4. 主題

這部分主要內(nèi)容是使用 DialogFlow,Python 和 Flask 打造 ChatBot。挺有意思的。簡單來說,ChatBot 是一種模擬人類對話(以文本和音頻形式)的計算機程序,我們將其視為智能和有用的。他們最重要的應用是個人或企業(yè)虛擬助手。

我之所以選擇了 DialogFlow,是因為: 

  • 融入 Google 的機器學習專業(yè)知識和 Google Cloud Speech-to-Text 等產(chǎn)品 

  • 是一項在 Google 云端平臺上運行的 Google 服務,可讓你擴展到數(shù)億用戶 

  • 非常適合初學者,直觀,并且具有完整而清晰的文檔

地址:

https://github.com/clone95/Virgilio/blob/master/zh-CN/Topics/DialogFlow.md

5. 工具

在學習的過程中,要熟練的使用Jupyter Notebooks、latex、Wolfram Alpha等等。

LaTeX 是一種標記語言(或者,如 官方網(wǎng)站 所述,“用于高質(zhì)量排版的文檔準備系統(tǒng)”) 用于創(chuàng)建精彩的論文和演示文稿。你在職業(yè)生涯中閱讀的幾乎所有論文都是使用 LaTeX 編寫的。

LaTeX 有幾個發(fā)行版,打開下面的鏈接可以看到

http://www.tug.org/interest.html#free

安裝后,你需要一個編輯器來編寫 LaTeX 文檔??梢允褂媚阆胍娜魏尉庉嬈?,包括記事本,vim,nano,gedit 等,但建議你選擇免費和跨平臺的 Texmaker 。

Texmaker

http://www.xm1math.net/texmaker/

另外,推薦下面這個網(wǎng)站,它允許用戶在線編寫公式,并且還有大量符號,你只需單擊,生成所需的代碼即可。你還可以預覽公式,以便更容易確保所有內(nèi)容都正確編寫。

網(wǎng)站地址:

https://www.codecogs.com/latex/eqneditor.php

WolframAlpha (WA) 是一個計算知識引擎。其具有強大的數(shù)學能力,它可以成為一個非常強大的工具來幫助你進行計算。具體的功能包括基本計算、繪圖函數(shù)、求解方程、解不等式、矩陣代數(shù)、計算級數(shù)和、求導、計算積分、求極限等等。

GeoGebra (GG) 是一個功能強大的動態(tài)數(shù)學應用程序,適用于所有級別的教育,它將幾何,代數(shù),電子表格,圖示器,統(tǒng)計和無窮小計算結(jié)合到一個易于使用的單一軟件。 GeoGebra 社區(qū)正以指數(shù)級增長,數(shù)百萬用戶遍布許多國家。 GeoGebra 已成為全球高等數(shù)學,科學支持,技術(shù),工程和數(shù)學以及教學和學習創(chuàng)新軟件的領先提供商。

下載及使用教程:

https://github.com/clone95/Virgilio/blob/master/zh-CN/Tools/GeoGebra.md

然后是正則表達式,這是一種匹配一種編寫匹配字符串的模式的方法。

使用教程:

https://github.com/clone95/Virgilio/blob/master/zh-CN/Tools/Regex.ipynb

6. 研究

這部分包含了 Zotero 和即將推出的最新論文。Zotero 是一個書目參考管理工具。廣泛用于研究領域(撰寫研究,論文或文章) ,它可以收集研究結(jié)果,保留細節(jié)(文本和參考文獻) ,然后創(chuàng)建參考書目。這有效地優(yōu)化了研究結(jié)果和參考文獻的管理以及文檔和編譯。

更多細節(jié),讀者可自行搜索和研究!

最后,附上完整的路徑圖,enjoy??

總的來說,這份 GitHub 項目內(nèi)容非常干!漢化版的資源極大地提高了學習效率。感謝原作者和漢化者的熱心付出和辛勤工作,該項目是機器學習非常好的入門教程,希望對大家有所幫助!

本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
AI 行業(yè)實踐精選:初創(chuàng)公司如何構(gòu)建自己的深度學習模型
玩轉(zhuǎn)TensorFlow?你需要知道這30功能
2018 年 8 月以來 5 個最好的機器學習 GitHub 倉庫和 Reddit 熱帖
一文看盡谷歌AI全年重大研究突破,Jeff Dean執(zhí)筆,全程干貨
干貨滿滿,谷歌科研成果 2018 年年終總結(jié)
老外推薦了十個學習計算機視覺視覺的免費網(wǎng)站(收藏)
更多類似文章 >>
生活服務
分享 收藏 導長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服