使用代理寫程式一個月

最近提升各種代理工具的使用量。約在一、兩個月前,Github Copilot 與 JetBrains 加入了此類功能,但完整度仍不及較早推出的 Cursor 及 Windsurf。不過上述軟體需額外訂閱,而我已購買多項 AI 服務,實在無力負擔更多。Github Copilot 的代理屬輕量級,可自行選擇模型,例如 Claude Sonnet 4。JetBrains 則由雲端任務分派器自動挑選最合適的模型。

兩套工具我都在使用:本機開發時我偏好 JetBrains,因其在程式碼分析與型別錯誤偵測上提供較多提示;VS Code 搭配 Copilot 的組合則適合連線遠端伺服器。目前最常利用代理的功能,是將原先寫在 Jupyter Notebook 的實驗腳本重構為較具結構的專案,建立 test、src、script、data、config 等資料夾與 requirements 檔案。這些工作並不複雜,但若由我手動處理耗時甚多且容易出錯,交給 LLM 則可多工、快速完成。其他常用功能還包括自動補上型別註解、撰寫說明文件,以及檢查潛在錯誤並優化部分程式碼。

目前正在考慮是否購買 Claude Pro 來試試 Claude Code;但是非 Max 只能使用 Sonnet 3.7,這樣我還不如用 GitHub Copilot。直接運行於終端機(CLI)的代理,好處是不需要處理編輯器資訊及頁籤上下文,但是使用者要知道如何檢視返回的成果。

而在雲端部分,因為我是 ChatGPT Pro 訂閱,所以有 Codex 可以用。Codex 內部的模型是 o3 特化版本,具備設置環境及上網安裝模組的功能,但模型本身不能連網。目前就是用來在移動中即可實現靈感、或要求整合性的除錯、文檔編寫。

整體來說,我覺得與代理一起寫程式的好處很多,使用者必須:

  • 構思清楚再開工,包含完整的 spec 文檔、限定活動範圍的 AGENTS.md 檔案等
  • 正確拆分需求,使得代理能夠順暢的完成多個小任務及拼接
  • 建立清楚的 Git flow 工作流,避免各 branch 互相干擾

目前在代理部分還有很多需要掌握的知識,遑論引入 MCP 到我的日常工作。感覺這些工具改朝換代的速度極快,一般人如果不每月花個把小時學習,很快就會被拋下(雖然是這樣,但拋下了又如何呢?)

附上一個我的代理使用畫面截圖: Junie & Pycharm 原本只有兩個寫的很鳥的 Jupyter notebook,通過 Junie 跟 Codex 運行了超過 35 個任務,彙整了我自己的醫院以及進修醫院的資料集,包含了處理、測試、檢視、文檔的完整專案。

Context engineering

另一個最近接觸的概念。隨著具備思考能力的大窗口模型日益普及(例如 GPT-o3),短而急促、密集的交互已經被證實是低效的操作模式,那種「你是個放射科專家」的奇異 prompt engineering 也早已不再需要。實務上,需要學習的是如何一次性的把足夠的資訊、預期的後續動作及關聯文檔提供給思考模型以獲得最大效益。

Context engineering is the delicate art and science of filling the context window with just the right information for the next step. (Twitter user @Karpathy)

LangChain 也有一篇文章 The rise of “context engineering” 討論。動態情境未必要要由 AI 工具來控制;它更像是工程師精心設計的操作台,一如冷氣遙控器 - 常用按鈕要單純,但能快速啟用複雜功能。

Most of the time when an agent is not performing reliably the underlying cause is that the appropriate context, instructions and tools have not been communicated to the model.

而除了合適的資訊,還需要提供工具讓 function call 能夠調用。這屬於 agentic system 的範疇了。由於 Codex / Junie 都具備自動夾帶程式碼的功能,所以我的目標是讓 LLM 知道它需要專注在那個程式碼上,避免它改動或錯誤讀取。我目前啟動 agent 的模板如下:

Goal:
一句話摘要本次代理預期達成的目標

Modification:
- → 要更改的檔案(new or update)

Instruction:
想要模型做的細節、error / log messages

自動發文到 GoToSocial

最近搭上 n8n 代理熱潮,著手研究。第一個可以用上的便是自動化填充內容到私人聯邦宇宙上某個自言自語用的帳號,方便我在發廢文的同時還可以從同一個地方監看各種訊息。我的實例其實運行的是名為 GoToSocial 的相容服務。

  1. 首先需要按照 Authentication with the API 取得授權碼。需要反覆多次,最終獲得 token_type 為 Bearer 的一串 access_token
  2. 可以用 curl 呼叫進行測試
  3. 最後在 n8n 的 HTTP request 元件中,選擇並填入 curl 指令,它會補入對應欄位
  4. 之後牽引對應項目(trigger)即可
curl -X POST 'https://<url>/api/v1/statuses' \
 -H 'Authorization: Bearer <access_token>' \
 -H 'Content-Type: application/json' \
 -d '{ "status": "Hello World!", "visibility": "public" }'

目前在考慮是否額外創建一個帳號,抑或共用目前的發文用帳號。我個人很喜歡《The Social Network》開頭 Zuckerberg 一邊做事一邊發文到 LiveJournal 那種感覺。在世界邊緣公開做事,等待有緣人發現?


2025-06-08 週記

4+2R 飲食法

4+2R 飲食法滿 16 天(從 05-22 起算,到 06-06),使用同一個體脂計,檢測早晨起床小便完後的空腹體重:

  • 體重:118.8 → 113.6 kg
  • Lean: 74.7 → 72.6 kg
  • Fat: 40.2 → 37.2 kg

是說 Lean + Fat 不等於體重,我也不知道怎回事,我是抄 Withing 的量測紀錄。Lean 的比例掉的有點多?我本來預期是 1:4 的換肉比,同時,減肥的效率比官方方式差,猜想是很多細節還是不如「官方」的要求:

  • 仍然睡不夠(戮力睡到八小時、早睡早起)
  • 我是使用調味蛋白粉、非分離式的乳清
  • 藻菇菜量偶爾大於 400 克
  • 還是會喝零卡碳酸飲料。

下週開始至少把睡眠部分達成目標。

買書

看了健身 Youtuber @shuaisoserious 的節目,買了《多巴胺國度》來更了解這玩意兒在行為心理上的影響。後面幾本除了《奇點臨近》剩下的都是願望清單的書目,趁著三本打折一併購入。

書名 價錢
多巴胺國度:在縱慾年代找到身心平衡 TWD $246
多巴胺國度實踐篇:在縱慾年代找到身心平衡的實務指南 TWD $272
超速進步:從新手到專家,12 條精通各領域的學習法則 TWD $287
阿甘節稅法:全方位理財第三堂課,讓你隱形加薪,退休金翻倍 TWD $345
12 週做完一年工作:縮短工時x成果翻倍的高效成功法 TWD $226
奇點已近:當人類與 AI 融合一體 TWD $400
如何衡量萬事萬物(經典紀念版):做好量化決策、分析的有效方法 TWD $292
Metadata 後設資料 TWD $247

2025-06-01 週記

今年生日在美國過,給自己買了禮物:

  1. 下單 Zpacks 的輕量後背包 Bagger Ultra 25L Backpack
  2. 預訂 Switch 2 帶瑪利歐賽車的版本
  3. 回國前再購買一台 mac studio 作為跑 LLM 用的平台

今天同時也是實驗室的團建日,去了 SF 北邊的 Alcatraz 監獄島參觀。晚餐一起去吃了一個波斯風格的餐廳(貴而且充滿澱粉,哎呀 😅)。實驗室的朋友們發現我今天生日,請吃了一個小提拉米蘇。

躺平

論文看起來是寫不出來了,果斷放棄。剩下的時間大致規劃如下

  • 玩遊戲
    • Stellar Blade
    • Clair Obscur: Expedition 33
    • Death Stranding 2
    • Dead Space
  • 讀書:
    • High-Resolution CT of the Lung
    • 複習 Core radiology
  • 數學、程式
    • Haskell 相關
    • DataCamp 至少完成五門課

土炮 4+2R

有感於體重跟腰圍已經來到不能忍受的程度,即刻對脂肪宣戰。之前有學到 4+2R 的飲食原則,主要是以高蛋白、重塑腸道菌為主的做法。它是由高雄的王姿允醫師所創立;王醫師鼓勵有意願的人前往診所諮詢並量身打造;當然因為我人在美國,所以只能土炮這個飲食法。參考的除了王醫師的兩本書《增肌減脂》《腸道健康食譜》,還有 Manda 的蔬食減脂生活這個網站。

R1(清除期)

短時間的流質高蛋白。R1 四天,降了四公斤多的體重(說是滯留的水及宿便)。飲水的部分每天都喝了快 5000 mL。手上有的蛋白粉是之前買的好市多 Kirkland 蛋白粉。王醫師是強調要分離式、無添加物、原味,但我沒喝完的話也不好帶粉回台灣,有點浪費所以就不額外添購。我另外注意到,官方的 MNT 粉裡面有混植物蛋白,具體來說大豆:乳清的比例似乎是 2:1 所以我從 Amazon 弄了兩包無添加的大豆蛋白來自己配粉。目前有稍微研究了一下土炮組的組合,回台灣之後一邊消化庫存品,一邊訂購,同時權充戰備存糧。

前兩天剛好有從 Weee 買來的豆漿換換口味;後兩天則是只喝混合蛋白粉。第一天是最空虛的,很想吃點什麼。後兩天身體差不多習慣了。大豆蛋白喝起來沙沙的,順口性倒是不差。不覺得有特別的豆腥味,就是權充燃料,一次喝半杯搖搖杯,再搭配一杯水。另外,微量營養素的部分我本來就有好市多買的維生素以及鋅鎂錠,繼續沿用。

R2(減脂期)

以豆腐、藻菇菜、蛋為主體的飲食。我個人本來就蠻喜歡吃這些的,所以從不同來源下單了食材,並準備了一些無糖、無添加物的醬油、辣椒醬,以及一盒泡菜。清點了一下剩餘的碳水,包括了幾包即食麵、兩盒有加糖的桂格燕麥片、一包大多力多滋、一袋冷凍芒果。計畫就是這些碳水一路吃到要回台灣,不再額外買碳水了。

放縱日

有時候會需要實驗室聚餐,目前看起來就是同事 Tician 返回瑞士前有一次,大概儘量少吃碳水、當天回來運動,以及後續兩三天要重返 R1 這樣。

去掉壞習慣

我個人認為來美國後體重居高不下的主要原因是拿便宜的牛奶當飲料。雖然沒有喝額外加糖的飲品或人造奶精,但是低脂牛奶本身其實含有很多乳糖,同時牛奶也容易造成慢性發炎。


Codex 第一手體驗記錄

Codex 原本是 OpenAI 2023 提出的一個協助程式設計的工具,也是最早期 Github Copilot 的後端。後來用此命名新的程式代理。目前有兩個版本:Codex CLI,消耗 API;以及雲端版,消耗 ChatGPT 訂閱。由於我是 Pro 用戶,自然最早用到。我手上有幾個小項目,分別是連結 Total segmentator 以及 Pyradiomics 的工具包,以及嘗試復刻 UCSF 研究工具(mPower)的報告處理工具(FuTools)。通過「o3 釐清需求 → 制定規範 → 設定 Codex 任務」這樣的流程,可以很快地、平行地展開多項任務。

目前的幾個缺點如下:不能聯網安裝額模組進行測試、強制接入 Github actions 的體系、送出 pull request 後不能追加 commit、只能在雲端運行。目前看起來官方會盡快補足這些部分。它的最大競爭對手是 Claude Code(包含在 Max 方案內)。

Codex


遊戲:潛水員戴夫

「潛水員戴夫」(Dave the Diver)從我出國前開始玩一路到破關,總共玩了 50 小時左右。遊戲主線大概只需要 15 到 20 小時左右即可完成,但因為遊戲融合了非常多種不同的要素,所以實際上玩的時間會更久。遊戲的要素大致如下:

  • 輕度 rough-like 的捕魚,並通過解謎及戰鬥來劇情推進
  • 農場、雞舍以及漁場的維護、採收
  • 壽司店的運營,包含菜單、人力,以及現場送餐

潛水員戴夫厲害的地方在於,用餐廳經營及漁獲養殖把玩法「閉環」並揉合為一體:玩家必須白天捕魚、戰鬥以供應晚上壽司店的素材、壽司店的營收則反過來購買道具推進探索深度。在捕魚及製作壽司的劇情中帶出發劇情及引入新人物,解鎖各種以 app 形式展現的功能。劇情部分並不複雜,後期匆促則是遊戲被詬病之處。遊戲雖然走像素風,魚類設計的卻也逼真。我們有次去桃園的 Xpark 水族館,居然認得出一些遊戲中有出現的魚蟹。

整體來說我覺得符合壓倒性好評的水準。值得一玩。


遊戲 漫威:星際異攻隊

玩完《漫威:星際異攻隊》走完主線共 19 小時。

遊戲本身是第三人稱越肩射擊,搭配各種能量累積的技能爆發,每個角色各有簡單的技能樹可以追加。正常流程下,每個角色大約可以點到八成左右。作為一款線性劇情的箱庭遊戲,本作的搜集要素不多,主要是一些零散的文本跟角色服裝。戰鬥-解謎-探索部分,戰鬥佔了絕大多數,解密異常簡單,探索則幾乎沒有,就是一條線走到底。劇情部分相當不錯,對比同工作室不知所云的《Tomb Raider》系列,本作拿到了 2021 年的世界遊戲大獎最佳劇本。

整體來說中規中矩,相當粉絲向,適合對漫威銀護世界觀有了解、有興趣的玩家。

決戰前:左起是 Gamora、Groot、Rocket、Mantis、Drax。視角是 Peter Quill。


美國進修記錄 03

轉眼來美國也過了 3 個月。雖然客觀上一事無成,但我心裡已經認同躺平哲學,覺得七個月帶不回一篇論文也可以接受 - 我出來享受人生難得的假期,多看看美國。四月上半女朋友來訪,去了迪士尼;現在在規劃六月底去美東看一看。

參加 STR 2025

STR 全名是 Society of Thoracic Radiology,主題是心肺相關的影像。今年舉辦的地點離舊金山不遠,是在洛杉磯南部的橘郡(Orange County),位於 Huntington beach 旁的渡假村。主題當然是聚焦在肺部影像。這裏恐怕聚集了全美大部分的胸腔放射科醫師。或許是得益於美國的換醫院做 fellow 的制度,大家都互相認識,也可以互相介紹拓展人脈。

裡面有一些冠名講座,講者多半是冠名的醫師的門徒,開場必定要緬懷恩師,並介紹該領域在今年的重大進展。例如 Dr. Gamsu 本身是 hypersensitivity pneumonitis,所以講座也是圍繞這個主題進行。

增加我的購物清單來源

除了來的第一天去了一次好市多外,再也沒去。主要的原因當然是交通來回所費不貲。就算搭乘 Uber,來回也要個 20 美元,這已經吃掉了很多的折扣了,更別提我隻身一人也沒辦法帶回來多少物資。最後嘗試了用 Instacart 訂,意外的方便,很多冷凍食品訂來可以立刻用微波爐使用。牛奶部分一加侖(1.8 L)大概是 5 美元左右,比台灣便宜。

目前在上面日常(三到四天)會訂購牛奶、冷凍蔬菜、一些熟食、無糖碳酸飲料等等,時間到了就下樓取貨,十分方便。


遊戲:古墓奇兵 新三部曲

這一個半月把《古墓奇兵》新三部曲玩完了,分別是

  • Tomb Raider 9
  • Rise of the Tomb Raider
  • Shadow of the Tomb Raider

各別玩了 20、17、17 小時。

第二部的東正教古城

第三部的印加密室

主要是解謎、戰鬥、探索三合一的模式,同期的作品有 Uncharted 神秘海域,算是競爭關係,玩法頗為類似,不過 Tomb Raider 在虛擬歷史部分著墨較多,有很多古物可供搜集。

  • 解謎:大部分的解謎都是機關,意味著必須嘗試啟動、連結或者破壞某些場景。主線的謎題難度不是很高,但部分支線操作方式需要練習很多次才能在時間內搞定(例如:支撐物只能等待 10 秒鐘,錯過只能重來)
  • 戰鬥:手感稀爛,第三人稱射擊但是並沒有子彈時間或自動瞄準,對電腦玩家不是問題但手把玩家感受不好。
  • 探索:場景設計頗為壯觀,攀爬部分偶爾會有 jump scare(例如手滑)但還可接受,不過有時候會像是刻意為了讓玩家爬而爬,習慣之後反而覺得無趣。

前兩部的劇情還算可以接受,第三部的劇情簡直是莫名其妙。敘事部分起頭當然是環繞 Lara 的父親各種關於世界神秘力量的探索啟發的冒險。第一部是日本東南方的邪馬台國,第二部是西伯利亞的東正教古國,第三部則是秘魯叢林的印加帕堤堤。除了第一部是由島民扮演反派角色外,後兩部則是由聖三一這個宗教組織擔當。

  1. 過多搜集要素:文物很多,有些其實也沒講解,就是 Lara 牢騷話。
  2. 雖然戰鬥規模砲火隆隆好像很宏大,實際劇情都是繞著幾個人之間的小打小鬥,看了很奇怪。例如,第三部裡面的叛軍進攻,居然是幾個拿著長矛的小兵。Lara 宰掉了敵方一大堆雇傭兵,反派也是說教幾句就走人。
  3. 場景很漂亮,建模蠻精緻的。一個小問題是到處都是骷髏、乾屍或慘死的士兵,玩起來沒有那麼愉悅。
  4. Tomb Raider 9 的畫質跟 Uncharted Remastered、Metro Redux 同級,也一樣都是線性劇情,不過總覺得推進的很突兀,角色(Lara)殺了第一個人的時候跪地啜泣,結果在接下來的劇情需要一路殺人。相比之下,像 TLOU 1 在鋪陳小女孩變戰鬼就好很多。

從戰鬥結果來說,Lara Croft 的體力值、戰鬥力都在她的兩位同行 - Nathan Drake 以及 Indiana Jones 之上,堪稱戰鬼一般的存在。


LA 旅行 - 星光大道、迪士尼、The Broad

04-06 星光大道

去了星光大道,跟我想像的不太一樣。簡單來說,像墾丁大街。雖然地板上有很多各式各樣的明星的手印、腳印,但整體來說蠻雜亂的,到處都是小攤販。在星光大道其實看不太到著名的好萊塢標誌,必須再搭車上山去某個看。杜比劇院跟中國劇院看起來其實也蠻破破爛爛的。我上網查是每年的奧斯卡頒獎典禮之前會有一波清理跟鋪設紅毯的措施,但是大部分時候是蠻雜亂的。

午餐在附近一家據說名氣不錯的泰式料理店解決。他們的炸雞蠻好吃的。另外途中搭了地鐵,真的是蠻可怕的,與舊金山的 BART 相比,社會底層的比例顯著增加,噪音、尿騷味也很多。從聯合車站搭乘 Metrolink 到 Anaheim,雙層車廂搭配柴油引擎,我猜是貨運鐵路兼作客運。

04-07 Disneyland

接下來兩天都是在迪士尼樂園度過。加州迪士尼樂園總共有兩個區域;兩個園區的門票加上快速通關,一個人要一萬多台幣,算是蠻驚人的開銷。也因為這樣,進去之前要先做好功課。要節省時間、盡可能能玩到比較多的遊樂設施,就必須要了解迪士尼的快速通關規則。簡單來說有以下幾個:

  • 最好玩的設施不提供快速通關。所以園區一開張就是先去排隊那個設施(Star Wars Rise of the Resistance / Radiator Spring Racers),在排隊的時候根據排隊狀況,預約第一個可以享受快速通關的設施。
  • 預約資格有兩種獲取方式:每隔一段時間(兩小時?)就可以預約下一個設施。或者是玩完預約的設施之後,也可以預約下一個。可預約的時間則不一定。
  • 有些熱門設施可預約的時間很快就會排到下午,所以如果消耗了「玩完出現的」預約點數,就必須要等固定時間後才能再預約。這中間的等待時間可以去逛商店、玩小型設施或者是去拍照、吃東西。

以下是 Disneyland 我們玩到的設施:

  • Star Wars: Rise of the Resistance - 互動式乘車體驗、劇情冒險
  • Millennium Falcon: Smugglers Run - 4D 模擬
  • Big Thunder Mountain Railroad - 雲霄飛車
  • Buzz Lightyear Astro Blasters - 射擊遊戲
  • Haunted Mansion - 室內劇情
  • Mark Twain Riverboat - 河上蒸汽船
  • Star Tours – The Adventures Continue - 4D 模擬
  • The Many Adventures of Winnie the Pooh - 室內劇情
  • Pirates of the Caribbean - 室內劇情
  • Autopia - 戶外自駕車體驗
  • Mickey & Minnie’s Runaway Railway - 室內劇情
  • Mickey’s House and Meet Mickey Mouse - 與米奇互動合影
  • Disneyland Railroad - 園區蒸汽火車巡遊
  • Storytelling at Royal Theatre - 現場互動式故事表演

04-08 Adventure Park

底下也是按照順序列出我們去玩的項目,表演則放在最後。

  • Radiator Springs Racers - 賽車體驗
  • Grizzly River Run - 激流泛舟
  • The Little Mermaid Ariel’s Undersea Adventure - 室內劇情
  • Monsters, Inc. Mike & Sulley to the Rescue! - 室內劇情
  • Silly Symphony Swings - 空中旋轉鞦韆
  • Incredicoaster - 雲霄飛車
  • WEB SLINGERS: A Spider-Man Adventure - 射擊遊戲
  • Guardians of the Galaxy – Mission: BREAKOUT! - 自由落體
  • Soarin’ Over California - 模擬飛行體驗
  • Mickey’s PhilharMagic - 3D 音樂動畫秀
  • Paradise Garden Bandstand - 戶外現場音樂表演

題外話,可愛的維尼熊頭在兩個園區個別只有一間店賣。冒險園區是在摩天輪對面的 Inside out 商店裡面販售。可以掛在髮夾上。

Disney 冒險園區的閉園水舞秀非常精彩,前所未見!

04-09

早上睡到自然醒之後離開旅館,搭火車返回洛杉磯市中心。今天計劃去 The Broad 美術館。美術館本身不用門票,但是需要上網預約。一樓很有名的無限鏡室也需要預約。美術館內有很多我們看不懂的現代美術作品,例如大名鼎鼎的氣球臘腸犬。

Broad 無限鏡室。

參觀完美術館後,我們去吃了一頓 Subway,然後參觀附近的迪士尼音樂廳以及洛杉磯第一個爬坡纜車。回去之前路過聯合車站旁邊的小東京參觀了一下,但頗令人失望的,感覺就是個日本風的商店街。真正的日本移民或許是住在附近的社區內?


2025-03-23 週記

本週金句,來自 Twitter 用戶 @xicilion

如果你用 AI 編程卻不讓 AI 寫測試用例,那你就不是 AI 的主人,而是 AI 的奴隸。你只是 ai 的測試員。

最近嘗試讓 ChatGPT 幫忙修改一個機器學習模型的輸出(直輸出 embedding vector),遇到了很多困難。AI 要嘛輸出一個根據它知識的概覽,要嘛根據函數名稱而非實際內容去設計新的程式,最終還是得回到編輯器內,老老實實用 Copilot。另外也準備轉型到代理工作模式。

覺得很疲累,感覺兩個月來沒做什麼正經事 😢 陸續跟科內的學長聯絡了幾次,打算接下來五個月的精力,七分用在回國後能做的東西上,兩分用在 LLM project,一分用在最沒有機會產出結果的 VLM project。

小作坊式的醫學研究

要如何以小作坊式的醫學研究要,在大機構、名校與科技業大廠夾擊下生存?純放射科 AI 的部分,當然跟中國、美國這些產學結合、有能力開發新模型的體系(Stanford、Alibaba 達摩院)完全是不同量級的。我自己的結論是:接影像相關的外包業務,幫臨床有學術能力的高手們的試驗案加值、或者客製化檢查 protocol 搜集資料,他們吃肉我喝湯。

政治發文導流到 Threads

本來是在我的本帳發文,但發現只會造成 Twitter 上認識的中國網友的困擾,因為有時候實在很想痛罵國民黨為支那黨(チナ党)。後來在我的 GTS 上開了一個新帳號,內容一樣會備份到我的 Obsidian 上,但是政治推文會轉向 Threads。當然,極端言論一定會引來巡邏的藍白草或機器人,不過反正我沒有裝 app,偶爾進去網頁也不會去看通知,當作是一個政治樹洞發洩管道吧。


2025-03-16 週記

上週二小島秀夫宣布了死亡擱淺二的第三部預告片,揭露了更多的場景、玩法與細節,看得我無比興奮。有網友留言:

Born too late to explore the world, born too early to explore the stars, born at the right time to play games made by Hideo Kojima.

真是說的太好了!今年最期待沒有之一。

Phanpy - Mastodon UI

Phanpy 介面是目前我的 Mastodon / GoToSocial 前端。之前測試過各種 app 或網頁,主要是用 IceCube 為主。手機部分也還是,但在電腦上習慣開著網頁看。這個 UI 蠻簡潔美觀,同時還有一些有趣的時間軸過濾功能。如果能夠用來當 Twitter 的前端就更好了。

魔法騎士雷阿斯

把 CLAMP 名作《魔法騎士雷阿斯》第一部的漫畫看完了,想不到兩部共六本漫畫可以擴充到 49 集動畫。然後在閱讀過程中順便了解了一下 CLAMP,原來他們的另一部名作就是《庫洛魔法使》。魔法騎士畫風是少女漫畫,實際劇情跟故事背景設定卻也不錯。主題曲「ゆずれない願い」真的是無敵經典。


生產力春藥 OpenAI Deep Research

一月 OpenAI 遭到 DeepSeek R1 突襲,除了 Nvidia 股價暴跌,也讓大家更加懷疑 OpenAI 到底護城河有多寬。於是就在 R1 發布沒多久,OpenAI 接連宣布開放十二月曝光的 o3 系列的 mini 版本,以及 Deep Research 工具。

其實 Google 在稍早就宣布了個同名工具,但使用人並不多也沒有燃起什麼熱情。這次宣布倒像是給很多 AI 狂熱者打了生產力春藥,一時間各種「十個必學技巧」再次洗版。我自己因為目前在做研究,也是每天要跟 ChatGPT 討教數十次;看到 o3 跟 Deep Research,果斷升級到 Pro,享用無限量的高級功能。

目前看來還有些問題:

  1. 無法使用付費牆後的資訊:畢竟模型的能力取決於其能接觸的文本以及背後搜尋引擎的能力,所以局限在各種它能搜到的範圍內。可以上傳 PDF 讓它讀。
  2. 文獻評讀能力:會照單全收各種來源的文獻,對於比較低層次的論壇文章好像沒有辦法很肯定的排除;偶爾也會使用過舊的來源。這點可能要在提示詞部分強調。
  3. 沒有辦法變出新想法:本質上就是根據既有的文獻去拼裝出使用者提問的答案。

整體來說像高級研究助理:速度很快的找出目前的進展,但是要繼續細讀或是規劃未來方向,可能還得靠人類。不過儘管如此,已經能節省大量時間,其提供的素材足可進一步討論。後續也能針對特定子類別發動新的搜尋,可謂是深度、廣度兼得的好工具。


美國進修記錄 02

開展 UCSF China Basin 的辦公生活

第一週主要都是在處理識別證以及院內信箱、科研系統等相關服務的問題。原本他們有給我一個院內信箱,但是這個信箱不知為何沒有成功啟用,所以花了不少時間重新開通。除了信箱外,還需要開通放射科閱片程式(Apex)、報告查詢(mPower)、資料下載以及可存取院內匿名資料的大型計算叢集(Wynton)。

在 CB 的座位跟德國/瑞士來的同事 Tician 共用,配備了一個 27 寸的螢幕。不過,沒有合適的鍵盤,手刀下單了一個 Nuphy 96,好看輕薄同時方便輸入數字。目前就是一邊完成 ILA 的資料搜集,一邊構思研究主題。

前往 UC Berkeley 開會

除了跟 UCSF 的老闆外,我同時還有一個附帶的工作,就是前往 UC Berkeley 的精準醫療實驗室跟著那邊的工程背景學生開會,看看他們都在做什麼。目前看起來是要協助開發他們的 vision-language model。需要更多時間來了解這個東西 - 在國內的時候從來沒聽說過這個;對放射科 AI 的認知還停留在相當早期的階段呀!

運動與健身

住的地方有簡易的運動空間

  • 有氧區域:兩台跑步機、兩台橢圓機、一台飛輪、一台划船機
  • 重訓室:一台多功能固定式 cable(可以做下拉、夾胸)以及啞鈴塔

至少要維持肌肉量,回國後再重新鍛鍊。