OCF UseR! 分享會
於 2016/07/13 前往摩茲工寮參加放文化基金會舉辦的 useR 聚會,這是我的筆記。
資料科學的推廣與實踐
謝宗震:DSP 智庫驅動 的企業資料科學顧問
- DSP DataCamp 核心價值為「實作」(即刻開始寫 code)以及「團訓」(混合組隊,在四天營隊中嘗試與不同領域的人合作)。
- 提升資料素養的方法
- 實體課程:基礎知識如統計、資料結構,以及程式語言(R、Python、SQL)
- 自學讀書:《聰明學統計的 13 又 1/2 堂課》、《統計學:最強的商業武器》、《統計學:最強的商業武器:實踐篇》、《An Introduction to Statistical Learning with Applications in R》
- 線上課程:Coursera 與 R 翻轉教室、Kaggle Tutorial、JHU - Launch Your Career in Data Science。
- 資料人聚會:DSP 的 Data Mixer 以及 Taiwan R User Group。
- 參加比賽:例如:高醫舉辦的 KAMERA 急診資料挑戰賽
- 「資料英雄計畫」是由政府機構或企業單位提供資料使參與者有長期可合作的專案,提供例如:家暴案件預防、火災、醫院按摩站分布、農藥、社福補助概況,的資料,讓參與者嘗試從中挖掘。
跨校合作資料分析
許文才
- 碩士班題材:R/quantmod
- 團隊建立:領域專家,負責提供想法、確認問題意義;程式專家,負責資料挖掘及處理;文案寫手,負責視覺化及呈現。
- 參與 2016 DSP 資料科學冬令營
- 提案目標是探討「台中市老人宜居空間」,使用「WHO 宜居指標」來評估(包含無礙、暢行、安居、社會參與、敬老、義工、聯通、社區)
- 成果,並以此投稿 UseR! 會議
UseR!2016 Conference 及趨勢
林庭蔚
- UseR!
- 2016 Stanford University
- 2017 Brussels,官方 Twitter
- 補充:講者大大有參加 UseR! 大會會後緊接著的 Bioconductor 會議,詳情有待講者大大從北京回來後分享!
- 投稿時程
- 2016/01/19 - 智庫營隊結束
- 2016/03/25 - Abstract 繳交死線且報名 oral presentation
- 2016/04/06 - 大會回復接受;中間尋找贊助
- 2016/06/18 - Poster 檔案給大會
- 2016/06/27 ~ 2016/06/30 - 大會
- 投稿規定:摘要、專案相關網站、程式碼 Github 頁面
- 補助來源及其規定
- 教育部:要求成果必須發表論文,以專業學術會議為優,且申請文書繁複,審核需要一個月左右;補助對象以個人為主,團隊難申請,也不容易核銷花費。
- 系所:也是以論文發表為主,需要系所有剩餘經費且須有指導老師署名。
- 開放文化基金會(OCF):若是投稿開源會議,則可申請補助!
- 怎麼知道的呢?
- 開放文化基金會三百壯士
- 國際交流計畫:青年國際開源會議盤纏申請
- 條件:需繳交幾個文件:會議主題、個人介紹、投稿內容、經費規劃書(住宿與機票)。最重要的是回國後必須自主舉辦分享會!
- 怎麼知道的呢?
- UseR!2016 內容與特色
- Workshop / Lighting talk / Poster talk / Sponsor talk
- Contribute talk:來自不同子群體的討論!例如:statistics、bioinformatics、kaleidoscope、other language 等
- 使用極富特色的個人議程管理網站 SCHED,提供如行程管理、social networking 等功能。可以知道哪些人想來看自己的 poster。
- 與會大咖
- Richard Becker:S language(疑似大會找來,用來反面宣傳 R 的開放與 S 之死)
- Donald Knuth:Literature programming
- Deborah Nolan:是 UCB 的資料科學老師,從最低階的原始資料(raw data)分析開始玩。介紹如何學習新的技術、使用已經有的工具而非從頭打造。
- Hadley Wickham:來自 Consortium / RStudio,介紹他們今年的發展重點:一致性包
tibble
(與dplyr
有關聯性。但是被社群評論為,意圖創造一個在 R base 之外新的語法)
- Poster 報告建議
- 練習很多版本的說法:因為每個詢問者對於報告的各部感興趣程度不一!
- 觀察大家喜歡甚麼:今年大家特別愛看機器學習相關的 poster
- 觀察大家怎麼設計 poster
- Lighting Talk,Larl Broman 的新手建議
- 慎選 lib:是否時常更新?開發者過去的 credit
- 有問題直接問開發者!因為有時候開發者不一定能了解使用者的苦處,寫信給開發者溝通有助於改善軟體親合度或難理解部分(註解:可發 issue?)
- 開發時注意 dependency,小心向後相容的問題!
- 如何建設自己的 lib community?