• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    數據科學

    數據科學家和機器學習實踐者的重要技能

    編者按:如果你有興趣分享你的數據科學和人工智能專業知識,你可以申請為我們的 博客 寫作。

    數據科學作為一門學科和專業,要求從業者具備各種技能,從溝通、領導等軟技能到演繹推理、算法思維、編程等硬技能。但是有一個關鍵的技能應該由數據科學家掌握,不管他們的經驗如何,那就是.

    即使是從事量子計算或醫療研究等技術領域的數據科學家也需要寫作。培養強大的寫作能力需要時間,而數據科學家面臨的挑戰是 MIG ht 阻止他們輕松表達自己的想法。這就是為什么本文包含了各種寫作策略,并解釋了它們如何有益于數據科學和 Machine Learning 專業人士。

    1 .短文

    讓我們從我們遇到的最典型的易理解的寫作風格開始。以簡短的形式寫作通常不費吹灰之力,也不會占用太多時間。 Twitter 、 LinkedIn 、 Facebook 、 Quora 和 StackOverflow 上的機器學習和數據科學內容都屬于這一類。

    Image with a laptop and mobile phone
    圖1:Austin Distel Unsplash 上的照片

    長格式內容,如書籍、文章和散文,通常是 ML 領域最有價值的材料。所有這些都需要時間來寫、讀和分析。另一方面,社交媒體平臺上的短格式內容可以提供信息,同時比長格式內容花費更少的精力和時間。

    目前,我們有幸見證人工智能先驅和著名機器學習實踐者之間的對話和想法,而無需等待他們撰寫和發表研究論文或論文。在社交媒體平臺上撰寫簡短的帖子可以深入了解不易口頭表達的觀點和觀點,您的聲音可以參與其中并分享觀點。

    對于那些想嘗試通過社交媒體帖子與其他 ML 專家聯系的人,我建議跟隨一些發布關于機器學習和數據科學的真實和相關信息的人。花些時間閱讀討論的基調和帖子上的文章,如果你有什么有價值的東西要貢獻,就大聲說出來。

    首先,這里列出了發布 AI 相關內容的個人列表(以及其他有趣的內容): Andrew Ng Geoffrey Hinton Allie, K Miller Andrej Karpathy Jeremy Howard Francois Chollet Aurélien Geron Lex Fridman 。還有很多人需要關注,但這些人的內容應該會讓你忙碌一段時間。

    問答平臺

    提問/回答作為一種寫作形式,具有最低的進入門檻,并且不會占用太多時間,這取決于你回答建議問題的能力。

    考慮到你的職業,我相信你一定聽說過 StackOverflow ,這是互聯網上最受工程師歡迎的資源。當涉及到關于 StackOverflow 的問題時,事情并沒有那么簡單;需要明確和透明。正確地編寫查詢是 StackOverflow 的一個重要組成部分,因此他們已經發布了一份關于該主題的全面指南。

    這一部分的要點是:詢問和回答有關 StackOverflow 的問題有助于您在提出問題時變得簡潔明了,在回答問題時也能變得徹底。

    2 .電子郵件和信息

    Image of laptop and mobile phone
    圖2:?Maxim IlyahovUnsplash 上的照片

    編寫電子郵件和消息并不是機器學習的特例,但從事編寫有效消息藝術的數據科學家和機器學習實踐者往往會在公司和團隊中蓬勃發展,原因顯而易見,其中一些原因是能夠貢獻、建立網絡和完成任務。

    撰寫好的信息和電子郵件可以讓你獲得一個新的角色,獲得項目資助或進入學術機構。 Purvanshi Mehta 寫了一篇文章,探討了在 LinkedIn 上發送冷消息的個人建立網絡的有效方法。 Purvanshi 的文章是關于可采用的冷消息傳遞禮儀的逐步說明。

    3 .博客和文章

    許多專家認為,博客和文章在機器學習社區中具有獨特的作用。文章是專業人士如何掌握軟件發布的最新信息、學習新方法和交流想法。

    技術性和非技術性 ML 文章是您將遇到的兩種最常見的文章。技術文章由描述性文本和描述特定功能實現的代碼片段或 GIST 組成。非技術性文章包括更多的描述性語言和圖片,以說明想法和概念。

    4 .時事通訊

    Developer seating on a table and working.
    圖3:cottonbroPexels 拍攝的照片

    啟動和維護通訊 或許不適合數據科學家,但這種寫作方式已證明為那些愿意投入工作的人提供了專業和社會優勢。

    時事通訊是DS/ML專業人士提高 AI 行業知名度和影響力的關鍵戰略舉措。時事通訊的寫作風格沒有定義,所以你可以隨意選擇。你需要開始一份正式的、冗長的、嚴肅的時事通訊,或者一份簡短的、內容豐富的、有趣的時事通訊。

    從中吸取的教訓是,制作一份時事通訊可以幫助你在你的領域、業務或組織中發展個人品牌。那些喜歡你的人將繼續消費和推廣你的材料。

    有一千個理由讓你今天不應該開始一份時事通訊,但是為了給 Spark 一些靈感,下面是一些你可以根據時事通訊的想法,我還包括了一些你應該訂閱的 AI 時事通訊。

    與人工智能相關的時事通訊想法:

    • 要觀看的 AI / ML 視頻集合,每個視頻上都有您的輸入。
    • 要閱讀的 AI / ML 文章的集合。
    • 求職者 MIG 不感興趣的您所在地區的職位公告。
    • 對人工智能的更實際應用感興趣的 ML 從業者的最新相關人工智能新聞。

    記住,時事通訊的頻率、長度和內容都是由您定義的。如果你覺得沒有太多的時間,你可以開始每月一次的時事通訊,或者每天一次的時事通訊來像機器一樣大量地制作內容。

    機器學習和數據科學通訊訂閱:

    5 .文檔

    Developer coding, with code displayed on a monitor.
    圖4:SigmundUnsplash 上的照片。

    技術和非技術文檔是軟件工程職業中的一項常見活動。數據科學家也不例外,解釋軟件代碼或單個功能的文檔是推薦的,并被認為是最佳實踐。

    項目何時成功?一些或許認為,當您的模型在測試數據集上達到可接受的精度時?

    經驗豐富的數據科學家理解,項目成功受許多變量的影響,包括軟件可維護性、壽命和知識轉移。軟件文檔是一項可以改善項目前景的任務,它超出了單個團隊成員的能力,更不用說,它提供了一個額外的軟件質量和可維護性層。

    數據科學家應該意識到文檔的一個主要優點是,它可以減少新項目成員或新手數據分析師對源代碼的查詢。關于源代碼的大多數問題都與文件位置、編碼標準和最佳實踐有關。這些數據都可以記錄一次并被許多人引用。

    以下是一些您可以記錄項目的想法

    • 代碼文檔:為了保證應用程序之間的一致性,標準化實現樣式和格式至關重要。這種一致性使得新開發人員更容易過渡到代碼庫,因為編碼標準是通過代碼文檔給出的。
    • 研究和分析:鑒于軟件產品特性的重要性,成功的開發總是依賴于徹底的研究和分析。任何一位在項目開始時就參與過項目的 ML 專家都會處理涉眾提出的過多的特性請求。記錄有關特性請求的信息可以使項目中涉及的其他各方更直接地了解所提議特性的需求和有用性。它還強制特征請求者進行更好的研究和分析。
    • 數據庫配置/應用程序信息:記錄特定于應用程序的信息,例如配置參數和環境變量,對于任何軟件團隊來說都是至關重要的,尤其是當您轉到新的工作或公司時。
    • How-tos :安裝軟件庫和軟件包可能很困難,但事實是,對于不同的操作系統甚至版本,可能有不同的安裝過程。在官方圖書館文檔中發現缺少的依賴項和安裝程序時必須經歷的怪癖并不少見。
    • API 文檔:當團隊開發內部和外部 API (應用程序編程接口)時,他們應該記錄這些 API 所需的方法、函數和數據資源的組件。沒有什么比使用非文檔化的 API 更煩人的了;整個過程變成了一個猜測游戲,您將花時間研究未記錄 API 的參數、內部工作和輸出。在使用您提供的技術資源時,通過創建流暢的體驗,為您的團隊和客戶節省時間。

    毫無疑問,廣泛的資源允許組織進行多種類型的文檔編制,有些組織甚至雇傭技術作者。盡管這些都是可行的選擇,但對于那些希望認真對待軟件完整性的機器學習專家來說,練習記錄程序和開發的軟件是至關重要的,這樣可以促進他們能夠提供全面解釋的想法。

    谷歌在“ ho怎么編寫好的軟件文檔w to write good software documentation ”上的快速搜索提供了 良好資源?,它們在文檔中共享相同的消息和最佳實踐。

    6 .研究論文

    Student studying in a library.
    圖5:Pexels Ron Lach 的照片。

    2020 年,我在 how to read research papers 上發表了一篇文章,這篇文章大受歡迎。在使用 ML 算法和模型時,我們必須優化閱讀這些論文的方式,就像經驗豐富的機器學習專家所做的那樣。

    寫機器學習研究論文是硬幣的另一面。我從未寫過研究論文,也不打算現在就開始。然而,一些機器學習專業非常關注寫作和出版研究。作為職業成功的衡量標準,研究機構和公司使用個人或團體發表的論文數量。

    寫研究論文是一門藝術;研究人員和科學家必須考慮數據的結構和內容,以確保信息、突破或想法得到有效傳遞。我們中的大多數人可能不會很快寫研究論文,但采用寫好研究論文的做法是有價值的。例如,有一個摘要,介紹和結論是一個寫作結構轉移到其他作品。

    繼續讀一些研究論文;注意作者使用的視覺圖像的語言、結構和用途。嘗試并采納你在下一篇文章中確定的任何良好實踐。

    7 .書籍和電子書

    A shelve of books.
    圖 6 : Unsplash 上 Nick Fewings 的照片。

    毫無疑問, ML / DS 書籍是關于機器學習理論和實踐專業知識的最權威的文本。我并不是建議所有的數據科學家和 ML 工程師都應該寫一本書。但請容忍我。

    我翻閱了書架上幾位用 AI / ML 寫書的作者,他們在各自領域都有豐富的經驗。

    寫關于機器學習的非小說、技術書籍是非常困難的。它需要高水平的理論和實踐行業知識,只有完全沉浸在學習、研究和實施中才能實現。要培養數百名 ML 工程師和數據科學家,您的聲譽必須建立在堅實的學術、商業或研究證書基礎上。更不用說,作家在創作好的作品時需要創造力。更具體地說,他們必須掌握在書中傳達復雜主題的藝術。

    我的觀點是,要創造一本永恒的機器學習書籍,你必須走專業化的道路。這聽起來并不誘人,但我想讓你考慮一個事實,即設定一個長期的寫作目標將推動你深入研究機器智能或選擇領域,這將增強你對 AI 的一般理解。

    面向數據科學家和機器學習實踐者的書籍:

    你會發現,前面列出的大多數作者在文章中列出的大多數不是所有形式的文章,不管他們的專業領域為何,所以我認為機器學習實踐者和數據科學家需要掌握的一項重要技能。

    結論

    每當我被問到什么樣的生活決定給我帶來了最大的好處,無論是社會上的、學術上的還是職業上的,我通常會用我的寫作決定來回答。

    在這篇文章中,您已經看到了數據科學家和機器學習專家如果定期編寫人工智能相關材料可能獲得的一些優勢。本節集中介紹了本文中列出的所有好處,以確保這些好處都能發揮作用。

    • ML 專業人員使用寫作以簡單的方式交流復雜的主題。通過閱讀 Andrej Karpathy 寫得很好的 blog pos t ,我對卷積神經網絡的實際應用有了更大的了解。
    • 不同類型的寫作可以幫助你提高創造力和批判性思維。我最近閱讀了 AI 2041 by Kai-Fu Lee and Chen Qiufan ,其中作者通過寫得很好的虛構故事和對人工智能技術的透徹解釋來研究人工智能技術及其對人類生活的影響。兩位作家都寫了很多年,還寫過其他的書。可以合理地得出結論,他們的寫作能力使作者能夠表達涉及 AI 技術的未來情況,并通過基于當前 AI 發展的批判性和邏輯性預測,探索 AI 集成的未知社會影響。
    • 以講故事的形式寫作給了項目生命。講好故事,寫好故事。向客戶、投資者或項目經理等利益相關者復述機器學習項目,與講故事的藝術相結合,會帶來積極和令人興奮的轉變。一位數據科學家向利益相關者解釋了為什么聯邦醫院應利用最新的癌癥檢測深度學習模型,當與患者早期診斷的故事結合時,該模型變得更具影響力和相關性。
    • 在機器學習社區中,寫作是一種成功的知識轉移方法。在 DS / ML 世界中,您將獲得的大多數信息都是通過書面內容獲得的。文章、論文和研究論文都是多年知識的寶庫,組織成簡潔的章節,有清晰的解釋和易于理解的格式。寫作是濃縮多年知識和經驗的有效途徑。

    你知道嗎,我們敬仰和學習的人工智能先驅和專家也會定期發表文章?在此 article 中,我編制了一份人工智能領域的個人短名單,并提供了他們的工作樣本,強調了他們工作的價值和后果。

    謝謝你的閱讀。

    ?

    0

    標簽

    人人超碰97caoporen国产