OCF UseR! 分享會

於 2016/07/13 前往摩茲工寮參加放文化基金會舉辦的 useR 聚會,這是我的筆記。

資料科學的推廣與實踐

謝宗震:DSP 智庫驅動 的企業資料科學顧問

  • DSP DataCamp 核心價值為「實作」(即刻開始寫 code)以及「團訓」(混合組隊,在四天營隊中嘗試與不同領域的人合作)。
  • 提升資料素養的方法
    • 實體課程:基礎知識如統計、資料結構,以及程式語言(R、Python、SQL)
    • 自學讀書:《聰明學統計的 13 又 1/2 堂課》、《統計學:最強的商業武器》、《統計學:最強的商業武器:實踐篇》、《An Introduction to Statistical Learning with Applications in R》
    • 線上課程:Coursera 與 R 翻轉教室、Kaggle Tutorial、JHU - Launch Your Career in Data Science。
    • 資料人聚會:DSP 的 Data Mixer 以及 Taiwan R User Group。
    • 參加比賽:例如:高醫舉辦的 KAMERA 急診資料挑戰賽
  • 「資料英雄計畫」是由政府機構或企業單位提供資料使參與者有長期可合作的專案,提供例如:家暴案件預防、火災、醫院按摩站分布、農藥、社福補助概況,的資料,讓參與者嘗試從中挖掘。

跨校合作資料分析

許文才

  • 碩士班題材:R/quantmod
  • 團隊建立:領域專家,負責提供想法、確認問題意義;程式專家,負責資料挖掘及處理;文案寫手,負責視覺化及呈現。
  • 參與 2016 DSP 資料科學冬令營
  • 提案目標是探討「台中市老人宜居空間」,使用「WHO 宜居指標」來評估(包含無礙、暢行、安居、社會參與、敬老、義工、聯通、社區)
  • 成果,並以此投稿 UseR! 會議

UseR!2016 Conference 及趨勢

林庭蔚

  • UseR!
    • 2016 Stanford University
    • 2017 Brussels,官方 Twitter
    • 補充:講者大大有參加 UseR! 大會會後緊接著的 Bioconductor 會議,詳情有待講者大大從北京回來後分享!
  • 投稿時程
    • 2016/01/19 - 智庫營隊結束
    • 2016/03/25 - Abstract 繳交死線且報名 oral presentation
    • 2016/04/06 - 大會回復接受;中間尋找贊助
    • 2016/06/18 - Poster 檔案給大會
    • 2016/06/27 ~ 2016/06/30 - 大會
  • 投稿規定:摘要、專案相關網站、程式碼 Github 頁面
  • 補助來源及其規定
    • 教育部:要求成果必須發表論文,以專業學術會議為優,且申請文書繁複,審核需要一個月左右;補助對象以個人為主,團隊難申請,也不容易核銷花費。
    • 系所:也是以論文發表為主,需要系所有剩餘經費且須有指導老師署名。
    • 開放文化基金會(OCF):若是投稿開源會議,則可申請補助!
  • UseR!2016 內容與特色
    • Workshop / Lighting talk / Poster talk / Sponsor talk
    • Contribute talk:來自不同子群體的討論!例如:statistics、bioinformatics、kaleidoscope、other language 等
    • 使用極富特色的個人議程管理網站 SCHED,提供如行程管理、social networking 等功能。可以知道哪些人想來看自己的 poster。
  • 與會大咖
    • Richard Becker:S language(疑似大會找來,用來反面宣傳 R 的開放與 S 之死)
    • Donald Knuth:Literature programming
    • Deborah Nolan:是 UCB 的資料科學老師,從最低階的原始資料(raw data)分析開始玩。介紹如何學習新的技術、使用已經有的工具而非從頭打造。
    • Hadley Wickham:來自 Consortium / RStudio,介紹他們今年的發展重點:一致性包 tibble(與 dplyr 有關聯性。但是被社群評論為,意圖創造一個在 R base 之外新的語法)
  • Poster 報告建議
    • 練習很多版本的說法:因為每個詢問者對於報告的各部感興趣程度不一!
    • 觀察大家喜歡甚麼:今年大家特別愛看機器學習相關的 poster
    • 觀察大家怎麼設計 poster
  • Lighting Talk,Larl Broman 的新手建議
    • 慎選 lib:是否時常更新?開發者過去的 credit
    • 有問題直接問開發者!因為有時候開發者不一定能了解使用者的苦處,寫信給開發者溝通有助於改善軟體親合度或難理解部分(註解:可發 issue?)
    • 開發時注意 dependency,小心向後相容的問題!
    • 如何建設自己的 lib community?