2026-04-12 週記
我若有百萬份的報告,並最強的模型,卻沒有病理診斷,我就成了鳴的鑼,響的鈸一般。我若有最豐富的影像,也明白各樣的疾病、各樣的表現,而且有強大的硬體,叫我能夠移山,卻沒有 ground truth,我就算不得什麼。
清理研究資料裡面隨附的病理分類很是麻煩。要讓 Codex 代勞,要跟他說 spawn subagent to recheck manually;加了 manual 這個詞他就會真的一個個下去看,不是寫一個瞎趴 NLP python 腳本過濾。我還注意到當 Codex subagent 完成任務時,main agent 會給出評價。有次我注意到 main agent 居然寫了一句驚訝 subagent 把事情做完了還把測試寫了。而且它還會抱怨遠端機器上的並行 Codex 動作慢,耐心很不夠。我有一個複雜的 meta-project 底下是各個不同主題的放射科專案,以及共享工具鏈。因為我在整併工具鏈,派出了很多個 subagent 去盤點各專題的相容性問題,結果 main codex 一直嘗試越過(不等待)subagent。下次要更新 AGENTS.md 叫它不要搞事。
最近還設立了不同設備之間的 Codex 通過 tailscale ssh 互相溝通的能力。在此之上,搭建了一個名為 FuBoard 的跨設備 Codex 讀寫優先的公布欄、圖床以及 SKILL hub。這個 hub 同時還有廣播功能,當 SKILL 更新的時候會呼叫 Codex 們來更新。
Claude Code 洩漏原始碼
Claude code 這次跌倒,開源社區跟掠奪者們吃了個飽,有一種鯨落的感覺。以 Anthropic 內準天才國度及有 Mythos 的狀態,很快就會再次跟這些 vibe coder 拉開距離吧。不過我執行主要任務還是靠 Codex。我最近做了一個把知識變成小卡的 SKILL,然兒使用 CC 搭配 Opus 執行任務,每次都會提出不太一樣的問題,輸出的一致性也不佳:有的卡片還是會太過複雜。相比之下,同一套 SKILL 用 Codex 執行就沒有這種不一致的問題。
重返生化危機
打完了羊蹄山戰鬼,想來玩 RE9,不過得先把前面幾作補完(RE2/3/7/8)。目前每一個都只有玩了開頭兩小時左右。RE8 是玩到把 lady Dimitrescu 的三個女兒打完而已。之前玩 RE4 一開始頗不習慣,後面覺得還行。不過劇情蠻薄弱的就是了。
退訂 Parallel Desktop
退訂了 parallel desktop;發現已經很久沒用這東西了。總共訂了五年之久,還不包含之前買斷的標準版(之前是為了用 vagrant + parallel desktop backend 買的)。不過我會注意到要繳費是因為約定扣款的設定過期了。然而儘管付費失效,卻也不能取消訂閱 - 難道我還得先付錢再來取消不成?然後網站的客服支援也太爛了,完全找不到地方寫信,跟 Uber Eats 是同一個樣子 - 沒有真人客服?出問題了是自己衰?最後是上 X 去問才找到人處理。
Decode Horos/OsiriX roi_series
記得 R1 剛進來的時候,科裡有醫師團隊花了很多心力用 OsiriX(一款 macOS 上的 DICOM 管理軟體)繪製了很多影像標注資料,但是由於 OsiriX 沒有跟上時代趨勢,這些資料使用了其專屬的格式存成 plist。我花了幾個月時間從 0 開始學怎麼看懂 obj-C,然後從開源版的 Horos 去逆向出他們內部的一整套多邊體標注及平滑模組,前前後後測試加成功萃取出資料,花了我大約六個月時間。對應的腳本還需用另一套 Horos python plugin 去執行。
結果今天 Codex 在幫我整理這批資料的時候,沒有找到這個手工解碼器,它在五分鐘內創建了一個新的版本:辨認出 plist 結構、拉取 Horos 原始碼、迅速找到對應的程式、跟已經跑出來的資料做比對,全部一氣呵成(如下面的截圖),然後事了拂衣去,淡淡地跟我說已搞定、已驗證。真是令人驚異。我 2023 年第一次嘗試 Github Copilot 也是處理同一個研究案,讓 Copilot 協助重寫整個檔案處理流程。經過它的完全重寫,一筆影像所需的處理時間從十分鐘變成三十秒,當時也是讓我冷汗直流。如今 Codex 再次重寫整批處理腳本,速度及準確度都更好。

我的認為對放射科來說,這兩年會有一波新的時代紅利 - 以前很多需要花極大量人工處理的臨床問題可能可以很快地用這些工具解決。因此實際上的速率限制步驟剩下資料搜集、清理。寫論文這事情則是最快的。
遊戲:羊蹄山戰鬼
其實本來是在玩《燕雲十六聲》,但是整個畫面提示及要素過多,看的有點煩;而且畫面的美術風格一直讓我想到《對馬戰鬼》。後來,決定還是來玩其團隊續作 - 《羊蹄山戰鬼》。整體來說,最值得稱讚的還是美觀部分,在歷來 playstation 平台遊戲可以佔前幾名。拍攝模式的物理效果變更也非常厲害。底下分成幾個部分來摘要我的感想:
- 劇情:比較單純的復仇情節,沒有了前代那種武士榮譽、家國興亡大義的劇情。不過前面結識了這麼多各路豪強,到最後結局還是一對一,有點過於日式了;怎麼沒有來一個復仇者聯盟式的大集結、大場面?分支劇情部分稍嫌薄弱,跟主線比較沒有關係,大部分都是解決各地雜魚,然後升等技能。比較有意思的是獲得新鎧甲部分,是打一些怪力亂神的「傳說角色」,例如彼岸花武者、境井仁的遺物等,這個做的很精彩。
- 戰鬥:前作只有武士刀的不同架式,羊蹄山戰鬼則可以學習各種武器,包括大太刀、鐮刀、火器等。學習武器是支線任務,不過只要推圖就會遇到任務。雖然大可武士刀過全場。不過遊戲故意設計成武器互相克制,還有輔助道具,想要玩的舒服還得逐個解開。
- 潛行:前作比較強調潛行,這一作由於標準難度下的主角太強,我其實從頭到尾都是直接殺進去,沒有在潛行的。不過,一開始先用長程弓箭擊殺一些不設防的小兵還是很有助於快速搞定據點。
- 解謎:一些偏遠的神社需要解謎跑酷,不過就是一路擺盪或攀岩過去。有種為了製造玩家困擾而設計的感覺。
- 連線模式:沒有特別去玩。有機會再來試試。
總共遊玩時間:37 小時。整體還算滿意,有享受到遊戲樂趣。
圖:漂亮的羊蹄山。
2026-03-29 週記
測試 Mastodon web client
測試了比較好看的 Phanpy 跟 elkzone,兩個都不能把網路連結變成 Twitter 那樣的「預覽」。Elk zone 介面比較像老 Twitter,Phanpy 則是截然不同的設計。我本來在想,應該在手錶上設計一個可以口頭發文的,這樣可以想到什麼就發什麼;後續通過 bot 自動整理到 obsidian 裡面。使用 SwiftUI 設計的 Icecube 的畫面比較緊湊,但是每次發文都要跳出一個新的 popup 視窗比較煩躁。
後來決定使用 elkzone 作為各種雜記用的介面,因為它的發文區不會額外彈窗。直接發就變成 timeline 的一部分。不過,如果要一直發瑣碎的短內容,最好還是使用 CLI app 來做這件事情,會比較舒服,反正發了就不用回頭看 timeline。
我另外在考慮增加一個機器人帳號,把有意思的內容推送到我的時間線上,有空順便看,就不用額外看充滿垃圾營銷內容的社交網站了。
Claude code 做投影片
讓 Claude Code (Opus 4.6)根據我的一組研究程式碼生成投影片,結果它用了類似 html2pptx 之類的東西,裝了一坨 npm modules 還失敗;不曉得是不是應該用 Cowork 讓它直接操作 Powerpoint?後來叫 Codex (GPT 5.4 xhigh),它大手一揮改成 Python 模組處理它改寫的 markdown,把事兒搞定。
Viridis
做圖表要考慮 Viridis 這種視覺強度可以跟數據匹配的配色設計;原版似乎本來就是色盲友善(藍黃色系)。也有各種顏色的變體,不過我傾向使用原版 Viridis 做設計;已經把使用這個配色寫入我的 AGENTS.md 了。參考文章:Domestic-engineering: Why you should use Viridis and not Jet (rainbow) as a colormap
放射科研究自動化初探:資料與專案分離
最近兩個月使用 Codex 5.3 及 5.4 來處理研究任務,越發地得心應手。模型能力大抵堪用,反而是工程的問題及技術債局限了更快的產出成果。底下記錄一下目前的心得,特別是把資料及程式本體「解耦合」的重要性。
去年中做研究開始大規模應用 totalsegmentator 來處理。那時候是每個專案各自有自己呼叫命令行 totalseg 工具的腳本(由 claude code 創建)。若有 radiomics 的需求就必須考慮品質管理(QC)以及對位擷取區域等。考慮到這些上游任務其實用的是同一套工具,嘗試整合。過程中遇到最大的問題就是新工具會把不同時期的工作流 dirty hack「硬編碼」進去新工具內來向後兼容。例如最早期的對位(alignment)工具,有一個無中生有的旋轉設定(因為處理肺臟的時候,沒有處理好 DICOM → NifTi 的座標轉換及 metadata 遷移。但是後來做肝臟有),結果導致整套工作流一直互相衝突。大部分補丁或 dirty hack 都應該儘可能予以去除,wrapper 部分能少就少。
隨著工具鏈整合,下一階段就是剝離資料、腳本、輸出。我把多個專案整合為一巨大的 meta-project。資料部分放在 data,腳本放在 projects,QC 資料放在各自專案下或定期清理的 output,而要寫論文的資料則推送到我的 macbook。這樣的好處是可以自動嘗試不同的任務。例如卵巢癌資料集,可以測試不同的模型、或者不同的任務(腫瘤分割、分類、預後機率評估等等)。
最近兩個月 Codex 實裝了(1)計畫模式(plan mode)(2)子代理(subagent)模式。這兩個新功能使得 content window 的管理更加的高效率。目前的核心轉向為「如何讓 Codex 成為近似人類的助理?」來節約工作。我目前用的 prompt 是「Spawn subagents with xhigh effort to check data manually while keep content window manageable」,並給出具體案例數。這樣的話,codex 就會確實一個個看過去,甚至會啟用 view image 來幫忙看看 QC 流程產生的圖片有沒有大問題。
總結幾個原則:
- 必須明確的列出資料轉換的步驟,然後確認沒有混入之前流程的 dirty hack
- 隱私無關的部分(例如把各式各樣的病理全名歸類為項目)交給 codex subagent
- 涉及病歷部分調用強力本地模型如 OSS-120B 做處理
- 若要把 GPT API 當作函數用來處理資料,則要設定 prompt cache
圖:計畫模式(plan mode)
目前我可以構造很複雜的 prompt,讓它檢查資料結構、已有的工具包等,然後我可以調整目標,設定邊界條件等框架,之後就可以去睡覺,讓codex 據此計畫搗鼓;目前觀察到已經可以連續工作四五個小時(會有 auto-compact 跟更新日誌等動作),起來就可以收很不錯的結果。也可以把想到的論文草稿,Codex 半成品及輸出丟給 extended pro,讓它給出建議 - 實務上,Codex 比較像極聰明的助手,ChatGPT 才有顧問的感覺。
我個人認為:不能讓 agent 連續工作好幾個小時的人,AI 操作能力恐怕還停留在 2024。
最近跟我弟說我們阿吉主任單純靠 ChatGPT plus,不用 agentic tool (例如 Cowork)就已經生產力大幅提升,兼顧這麼多研究專案並瘋狂產出結果,如果用了豈不是要飛天?我弟說:「你就是你們老闆的 agent」,我竟一時無法反駁 😂
2026-02-15 週記
試玩與棄用 Clawdbot
Clawdbot(→ moltbot → open claw)上線沒多久就立刻弄了一隻來玩玩,不過主要是在我東京的 VPS 上試運行,不敢跑在我內網的機器裡。一開始的任務,是讓部署在 VPS 的 Clawd 逐步使用自訂義腳本來接手原本給 n8n 的任務,以及把想像中的類 1feed 功能做出來。不過,效果不如我的預期(我是給他 medium thinking effort codex)。
隔兩天發現居然有人弄了一個給 claw 用的社交網路。算是有創意 - 不過似乎很多 KOL 有意或無意的把這網站當成 agent 自主發布內容。實際上,任何 LLM 要搞事,背後都還是要有一個起頭的 prompt,哪怕這個 prompt 是叫 agent 自己定時發文,特別是什麼 molt 自主產生宗教;根本是狗屁倒灶的東西。
一週後放棄使用 OpenClaw 了;可怕的、骯髒的上下文控制,我還不如用 Blink 來遠距離控制 Codex 即可。
補充;後來 Claude 推出了自己的競品叫 Dispatch,不過並不好用。一次只能在一台設備商運行,且自我維護、SKILL 管理能力極弱。
2026-01-04 週記
Crocs 洞洞鞋好像有很多洞很通風,但實際上並不是那麼一回事,而且材質會過於貼膚擦一整天反而有一個酸臭味。
新飛輪、新手錶
十一月底的時候被同事的每日飛輪運動燒到了,最後選定了一台 BH G10 號稱有精確功率計的高級飛輪。首先去萵苣重新適應了一下飛輪,學習如何調整高度,不過一個小時的課程還是太操了。
卡踏、卡鞋
飛輪自帶 SPD 規格的卡踏。在車來之後也訂購了一雙 Shimano 的 SPD 規格卡鞋。買回來才發現發現原來卡鞋不是自帶扣片 - 還好飛輪有帶一組 SPD 扣片,不然還得再訂。卡鞋的腳感神奇,有一種人車一體的 feel,不過脫卡的時候一時半刻弄不下來。發現是鎖的不夠緊所致。有了卡踏後還需要學習新的動作:除了踩踏板的模式必須從一般 YouBike 那種單純靠股四頭輸出的模式轉換成有卡踏的騎法外,還有一些高踏頻低阻力的訓練策略;可不是買了飛輪就猛騎那麼簡單。
心率記錄
蘋果錶的心率沒辦法傳給車機,只能靠 Rouvy 之類的軟體同步接收,思考是否應該買一條心率帶。之前嘗試同時開啟心率廣播及運動記錄,發現心率廣播會斷斷續續,不穩定。我還注意到用了五年的蘋果 S6 錶電池容量剩 60%,快不行了。據說換電池會影響防水,只好買了個新的 S11,舊的關機收起來。廣播在換了新錶之後有好一些,猜測是因為我老舊的蘋果錶沒辦法承受同時廣播心率跟運動模式。
Rouvy
Rouvy 是一套虛擬騎乘軟體,看風景騎車蠻好玩的,主打的功能是自動調節訓練台,不過飛輪只能自己轉阻力來模擬坡度;似乎也會根據坡度跟我輸出的功率來變化前進的速度。設定好從 Rouvy Strava 到 Apple Health 的輸出,這樣也可以累積每日活動量數據。在訓練的時候也時刻注意自己的輸出。有了數據之後才知道,6.0 W/KG 蠻可怕的。我需要用 zone 4-5 等級的心率騎,只能堅持 2 分鐘,職業車手可以用同等級的出力程度騎一小時。
2026 年度計畫
全年計劃
- 每個月減 3 公斤,目標是春節前減到 100 公斤以下,六月前減肥到 85 公斤
- 自訓、負重、備戰(防災)
研究
- 春節投稿出三篇 SCI 論文(手上都有半成品了)
- 淋巴水腫、Lung-RADS 推論、Sybil-RADS 計分機制
- 整頓好 homelab,把目前的混編硬碟陣列跟專案結構等改造成適合 agent 運作的模式。
學習
- 放射科:把肺部影像教科書看完 - 目標:每週更新筆記
- 基礎能力:
- DataCamp 完成 R & Finance 以及統計的 track。
- Udemy 完成 Luke Priddy 英文課程及 Lazy Programming 的 DL 課程。
- 設定每週可查核筆記數量 - 匯報於週記
2025 日本旅行:木更津、東京科學館、柴又
跨年夜出發前往東京(雖然從 RSNA 回來的時候也去了一下東京,不過並沒有停留太久)。這次本來計劃去日光或鬼怒川,不過也正值日本年假,飯店極為難訂。最後放棄,都是走當日可來回的景點。抵達後已經是 12/31 下午靠近傍晚了。本來想去到處晃,結果太累了一樣睡到了晚上。起來後本來想去兩公里外的淺草雷門,但是看直播發現新年參拜人潮極為洶湧,於是在飯店休息補眠。
01/01 鋸山、木更津
從千葉往南轉搭內房線,在木更津換兩節列車,在浜金谷駅下車,然後徒步到纜車站。山頂風大,可以縱覽整個南東京灣,是一個很舒適的景點,遊客頗多。跨越稜線後是日本寺的範圍,有千五百羅漢道、千年歷史的石雕大佛可以看。一路順行下來後其實剛好卡在兩個車站之間,要回去要再爬一次山,十分痛苦,所以選擇走兩公里的產業道路去下一站。這中間要看好列車時刻表,不然錯過了就要再等一陣子。
圖:浜金谷駅
回頭後去了三井木更津 outlet。商店其實八點就關門,七點半紛紛開始趕客。我們今天太晚出門了,所以實際抵達木更津已經六點了;吃了久違的 shake shack,逛了一下剛好買到福袋,就離開木更津搭車回飯店。
01/02 東京科學館、大絕滅展
大絕滅展最早來自小島秀夫的推文。前幾週來東京的時候,老弟也有自己去逛。東京科學館從日本各地的博物館借了很多不同時期的主流生物化石來展覽,包含很多細緻的貝類、植物化石,介紹了歷來幾次大絕滅發生前地球上的主流物種大概是什麼模樣、目前推測的大絕滅發生原因等。科學館本身則有很多有意思的人文、自然及地質內容。最震撼的展品是一個禁止拍照的蔭屍標本。
晚上則快閃新宿,目標是參觀東京迪士尼旗艦店,這裏有一些迪士尼樂園沒有的特典商品。本來是要找粉色維尼,不過好像已經換季,變成其他種類的維尼了。最後買了個毛絨大維尼跟一個雙層白色維尼(內有一個大頭維尼,神奇的套皮組合)。
01/03 銀座、哈利波特影城
中午去銀座附近逛順便尋找午餐吃,意外發現櫻花大戰裡面多次出現的「煉瓦亭」,不過今天沒開,殊為可惜,不然我鐵定是要進去吃一頓的。下午靠近傍晚則是去今天的主行程 - 東京哈利波特影城。裡面有很多 cosplay 來的年輕人借裡面的場景道具拍照。買了全口味豆來試試,是奇異的調味品混合成,包含了「鼻屎」「胡椒」等亂七八糟的口味。我自己覺得場景蠻普通的 - 後來發現是因為之前玩過《霍格華茲的傳承》,裡面忠實的還原的電影及小說場景,而我已經在那個虛擬世界走了無數次,太熟了。
圖:歷來的哈利波特電影海報
01/04 柴又
最後一天是下午的飛機。早上退房後,去了葛飾區的柴又。這是是一個比較在地的景點,當地遊客幾乎都是日本人,沒看到什麼外國人。去了帝釋天寺,我們也掏了一點香油錢抽籤。我抽到一個不怎樣的凶:「枯木未生枝,拳步上雲歧,豈知身未穩,獨自惹閑非」。看起來是警告我論文沒一撇,要低調多努力,不要顯擺?之後就學習我在一些影片看到的一樣,把這個壞籤綁在專用架上,象徵留下凶運。
2025 RSNA at Chicago
11/29-30 抵達、開幕
飛機是搭乘長榮自 TPE 往 ORD 的飛機,匆匆忙忙從家裡出發。不曉得為什麼,耳朵靠在椅背上的時候,震動感很明顯,導致我整路都沒有睡著,就這樣熬了十幾個小時抵達芝加哥。結果當天稍早有暴雪,O’Hare 機場甚至一度關閉。落地的時候停機坪及滑行道塞滿了飛機,額外又等了兩個半小時才下飛機(趁機把不可能任務看完了)。這次拿的是 ESTA 旅行簽證。可能是去 RSNA 的人太多,海關只問我兩個問題「這次來幹嘛(RSNA)」以及「停留幾天(六天)」就放我過關了。
等行李又額外花了一個半小時,搭 Uber 去市區花了 40 分鐘,最後在芝加哥時間凌晨兩點才抵達飯店房間。澡都不洗躺下就昏迷,一路睡到了隔天近中午,去附近的 7-11 買了我魂牽夢縈的零卡激浪 Mountain Dew,吃了早餐才悠哉悠哉的去會場報到。因為我有買 virtual access,所以其實並沒有計劃去聽演講(很多非英語母語的講者,品質參差不齊)所以我大部分時候是去看海報、看參展的廠商有什麼酷炫的產品。
圖:拍攝於 McCormick Place 連結湖畔會議中心(Lakeside)與南棟大樓的天橋,可以遠眺芝加哥市中心。
晚餐參加了所謂的 Taiwan Night,成員是來參加 RSNA 的台灣放射科醫師,吃位於一家市中心的港式茶點。隔壁坐的是三總的放射科醫師,去 Stanford 進修肝臟及腹部相關的影像。本來今天還要趕場原本的美國老闆 Jae 來芝加哥的實驗室聚餐,但是他的航班因為暴雪被取消,所以他最後不來了,殊為可惜。
12/01
今天參觀了南北會場的所有攤商,琳瑯滿目,從賣個人防護設備到新型機器的樣品都有,例如可以垂直掃描的 CT 等等。最大的攤位來自幾個巨頭,例如中國的 United Imaging,德國 Siemens 以及日本的 Canon 等。晚上有 UCSF 的校友會,本來也想去看看大家,但是我可能是天氣冷,鼻竇炎有點牙起來,頭很不舒服,早早就回去飯店休息了。
12/02
早上找了幾個演講簡單的聽了下,順便利用會場的高速網路下載各種有意思的演講主題。午餐後則前往 Field Museum 參觀。從 McCormick Place 走過去大約需要 30 分鐘(兩公里多)。沿著密西根湖畔走,意外的雖然外頭是零下,但做好遮蔽並沒有到很冷。Field 博物館大廳是脊龍跟泰坦巨龍化石(《侏羅紀公園:重生》均有出場,實際化石比我想的小隻。一入場就是去找演化大廳,看著名的霸王龍化石 Sue。整個博物館的主題算是自然歷史及人類歷史,所以有不少印地安館藏。地下一樓則有埃及文物、木乃伊等(不過跟紐約大都會博物館相比,數量差很多)。
圖:Field Museum 的入口照片,真正的脊龍,四隻發達。後面有一隻泰坦巨龍,兩龍均有出現在最新的《侏羅紀世界:重生》裡面。
晚餐是科部聚餐,吃 Shaw’s crab club,不過我點了個牛排。主要成員有我們科以及另一桌台南高雄的放射科醫師。簡單吃一吃就回去了;離開的時候另一桌還在上主菜呢。
12/03
今天在會場見了以前在美國實驗室的一些同事和指導教授。下午則跑回去飯店做自己的事情。晚餐吃千禧公園對面的 Giordano’s 深盤披薩專賣店,滿滿的碳水!吃完後走去溜冰場。不過溜冰場的鞋子很不合腳且很臭,滑起來跟我溜直排輪感受差異甚大。
12/04
RSNA 的最後一天。今天也是睡到快時限才出門,畢竟晚上就要搭乘長途航班飛東京。搭上最後一班接駁車去會場。今天理論上是我的海報日,不過現場人數跟第一天相比大概少了四分之三,很空曠。我的海報電腦被前一個時段的日本大叔佔據跟過路人大力推銷他的研究,時間到了還在嘰哩呱啦的講,沒打算還給我,所以我就在附近繼續下載有趣的 RSNA 投影片。
去機場要轉一次車。從會場南棟直接下樓就是 Metra 站點很方便,終點站就是千禧公園,跑上去看了一下 Cloud Gate(大鐵豆),然後轉 blue line 去機場。下一次來的話,可以考慮從 McCormick Place 搭車去南邊的科學技術博物館。
圖:大鐵豆。
Blue line 走走停停。如果順利的話也是需要快 50 分鐘;加上延誤整整變成一個半小時的長程列車。飛東京我是搭 JAL 的飛機,不過班機大延誤且座椅不舒服、飛機餐馬馬虎虎。下次還是考慮全日空或美聯航吧。
12/05-12/06
回程沒有直飛台北,而是先去東京鬼混兩天。跟弟弟去舞鶴海濱展覽館看東京漫畫展(TOKYO COMIC CON 2025)。大部分是美漫角色居多,繪師都不認得,不過老弟有在看美漫,如數家珍。傍晚去了魂牽夢縈的秋葉原。上次來是一年多前了呢。第二天則去六本木看新世紀福音戰士 30 週年展覽,有一些珍藏原畫及高解析度的 AAA Wunder 模型。
圖:從六本木瞭望台看東京市
遊戲:生化危機四 重製版
生化危機(台灣翻譯:惡靈古堡 Resident Evil series)有名程度自不用我多說。不過,我其實買了 2 / 3 / 4 很長一段時間了,但是都只玩了開頭一小段就沒有繼續 - 遊戲中彈藥資源比最後生還者還匱乏,同時也缺乏好的自瞄機制,使得玩起來不那麼爽快。後來因緣忌諱玩了一會兒 8,發現比想像中有趣,於是重新啟封。
目前主遊戲走了一輪,DLC 艾達劇情也已完成,底下來記錄一下心得:
- 劇情部分:不像頑皮狗嘗試在遊戲外加入劇情(與說教),或者是死亡空間(台灣翻譯:絕命異次元 Dead Space)那樣主打更多的恐怖,生化四的劇情蠻無腦的,基本上就是男主角闖入邪教幾敗教主及其背後的陰謀實力。由於劇情如此,角色設計也顯得很扁平。
- 場景設計:RE 引擎的物理特效還行,場景建模還算有在歐美 3A 遊戲水準平均上。
- 戰鬥部分:主題還是射擊,不過是那種要擬定戰術,盡可能偷襲為主的打法。後期解鎖了更多武器後可以有比較多種策略,同時相比生化二可以彈反一部分攻擊這也是很酷的特色。不過,武器耐久度的部分還是滿頭大的,刀斷掉後不能彈反只能掙扎會扣血。初代的最後生還者也有類似的機制,迫使玩家必須努力去撿垃圾來維持裝備而不能直衝主線。
- Ashly:我有看了一些評論跟當年原作的錄影,以前真的是比較惱人,在這個重製版倒是還行,可以有基本的避難指揮,角色建模也賞心悅目。
重返 Codex
從之前的 Codex、ChatGPT Pro 換到 Claude Max 再回來 Codex,轉瞬之間半年又過去了。代理程式變化的速度極快,對於研究範式的衝擊遠大於當時 GPT 3.5 推出以及從 GPT-4 變化到 GPT-4o。
上圖是使用 Codex 對我的四月多基於 MedImageInsight 與卵巢癌電腦斷層研究的修正,改成使用來自 UC Berkeley Yala Lab 的 Pillar-0 模型。目前這部分的工程還在進行。
跟之前最主要的相比是,原本我的工作流程極度仰賴 Claude plan mode,也就是把複雜的工作寫成長 prompt,交給 Claude 一陣搗鼓後,審核它所提交的計劃;有時候需要些微修正個兩三次,之後觀察它修訂。Claude 是一個聰明的工具,但是背後的 token 消耗速度極快,同時,直到 Sonnet 4.5 之後才有比較穩定的運作;再之前是 Opus 4 配上 Sonnet 4,token 消耗超過一半會降低智商。Codex 則沒有這個問題,我後期切換的時候已經全線 GPT-5 了。在解決個別 issue 上也很聰明。針對 Codex 沒有 plan mode 的解決方法,官方是建議使用唯獨模式要求 Codex 提出 TODO;等待修正後再讓其依據 TODO 做事;另外就是要有定期備份的習慣。軟體工程切分 issue 大小也是一個很重要的技能。
2025-09-14 週記
Notes
2025-09-01
- 23:25 #飲食記錄
- 早餐:韋恩咖啡(19.5 克糖)
- 午餐:光泉特濃咖啡
- 晚餐:豆腐、白菜、半份拉麵、吃剩的韓式炸雞兩塊
- 點心:蛋白粉 90 克
2025-09-02
- 21:41 #飲食記錄
- 早餐:Dr.Milk 咖啡一瓶(17 克糖)
- 午餐:饃饃噠(京醬牛)、豆乾
- 晚餐:豆腐、蔬菜、少量麵條
- 點心:蛋白粉 60 克、義美紅豆牛奶冰棒、芭樂一顆
2025-09-03
- 21:26 #飲食記錄
- 早餐:Dr.Milk 咖啡一瓶(17 克糖)
- 午餐:全家烤蛋白餐盒
- 晚餐:CJ 酪梨牛肉堡、雞米花
- 點心:豆漿 500 mL、芭樂半顆
2025-09-04
- 22:45 本來以為博人傳已經是狗尾續貂的第一名了,沒想到還有更屌的 - 咒術迴戰MODULO - 不過嚴格說起來原作也暴走爛尾了,所以也沒什麼特別了 😂
- 23:13 #飲食記錄 早餐:韋恩咖啡 午餐:鬍鬚張的燒肉便當(開會的便當) 晚餐:少量燒烤(兩根豆乾、一根美式熱狗棒、一個玉米) 點心:半杯酪梨布丁牛奶,400 mL 無糖豆漿。
2025-09-05
- 12:49 今天的好戲是明英宗自土木堡之變後從瓦剌獲釋,目前被軟禁在南宮,不知何時要發動奪門之變復辟?
- 23:23 強勁的股四頭跟臀大肌,哪一個對整體體態更好?
- 23:47 #飲食記錄 早餐:全家瓶裝拿鐵(糖 17 克) 午餐:食悠牛排健康餐、五十嵐無糖拿鐵 晚餐:漢堡王華堡、四塊雞塊、小薯 宵夜:500 mL 無糖豆漿、芭樂一顆
2025-09-06
- 02:36 維尼熊性別為何
- 16:06 應該整合天氣預報到這一個聊天平台 比方說每四個小時通報一次天氣或者是即時訊息
- 17:00 要盡可能降低非運動會日的碳水攝取
- 21:17 目前考慮收下列的 Switch 遊戲 薩爾達-智慧的再現 碧姬公主-表演時刻 瑪利歐-奧德賽 路易吉-洋樓 1 + 2 (AVG)命運石之門 世界樹迷宮 萊莎煉金術士 1 + 2 + 3
- 23:37 #飲食記錄 早餐:Dr Milk 午餐:沒吃 晚餐:大戶屋黑醋雞跟一半的泡菜豬肉豆腐鍋 點心:一包新貴派、一根綠豆冰棒、乳清 60 g
2025-09-07
- 00:53 Switch 的遊戲看著挺多的 - 之前沒空玩,累積了一大堆
- 01:07 劍指結拳指底不能彎。應以沉腕旋力畫合手肘畫圓行太極透氣畫字氣。五雷左手拳面向上四指圓曲成陰儀大姆指下肉丘實圓腕成陽儀。五雷拳底向地引地氣。陰陽儀面引天氣。天地合拳道ㄧ生二儀引天雷會化五行承氣旨行五雷。才為五雷劍形訣。
- 17:00 下週開始完全戒除含糖咖啡當早餐
- 23:54 #飲食記錄 早餐:無 午餐:一半的必勝客比薩 - 邊緣餅皮不吃 晚餐:蔬菜、豆腐、半包拉麵 點心:一杯酪梨布丁牛奶(半個布丁)、乳清 90 克
2025-09-08
- 12:33 看到財劃法被惡搞,可悲卓榮泰到現在還想著擦屁股 #politics
- 20:22 把 Switch 跟超酷的透明手把轉交給老弟,看起來可以買一些實體卡來玩了。之前的一些瑪利歐遊戲也可以搜集一下(例如剪紙、鬼屋、奧德賽)。
- 23:24 #飲食記錄 早餐:黑咖啡 午餐:漢堡王套餐(薯球吃一半、6 塊雞塊、華堡) 晚餐:十個玉米高麗菜水餃 點心:乳清 40 克、蛋兩顆、半個芭樂
2025-09-09
- 08:35 Kobo 週年慶,來買個書讀
- 18:06 ETToday 這則新聞居然幫卓榮泰說話,真神奇 Link
- 23:40 #飲食記錄 深切反省 早餐 無 午餐 便利商店豆皮壽司、大蒜麵包、濃豆漿一瓶 晚餐 鬍鬚張大碗雞肉飯 點心 蘇打餅一包
2025-09-10
- 00:38 想到藍白首長聯合記者會要痛罵民進黨,賴卓政府又要出來當聖母幫忙擦屁股了 唉😮💨 #politics
2025-09-11
- 00:55 啊!Codex 完全不行啊,要它從某個專案做參考,複製出核心模組到現在工作中的資料夾,重新設定 prompt,以當前資料夾的資料為材料,呼叫本地 LLM 做病歷資料清洗,搞的一團糟。
- 00:57 Anthropic 趕快恢復哪!好幾個專案等待過夜執行的 😓
2025-09-12
- 23:36 #飲食記錄 早餐:自製拿鐵 午餐:7-11 鮪魚肉鬆飯卷、濃豆漿 晚餐:大戶屋黑醋醬雞肉套餐 點心:豆漿 400 mL
2025-09-13
- 21:50 #飲食記錄 9/13 早餐:咖啡+無糖豆漿 午餐:能量小姐健康餐(蔥鹽雞胸肉) 晚餐:摩斯漢堡(只吃一半的薯條雞塊、無糖紅茶) 點心:乳清 90 克
2025-09-14
- 00:19 今天解鎖兩個技能(1)使用 AutoHotKey UIA 來控制 Windows 桌面軟體(2)逆向 Python 寫的 exe 執行檔,反編譯裡面的腳本。
- 09:56 最近回國,準備加緊腳步做點事情早日升上助理教授。有高人指點,低調行事 - 簡單來說就是「高築牆、廣積糧、緩稱王」
- 14:52 弄到了影像自動下載工具,雖然逆向出了主體結構,但是具體細節還得再研究,而且想更新成新的 exe 有點難度,特別是需要 Windows 環境。
- 15:15 原來通過 n8n 發出的訊息是unlisted,這樣我的部落格就缺少了滿多公開的博文
- 17:53 Medgemma-27B 的運作速度比 Qwen-30B 慢,為什麼呢?😖
- 23:49 9/14 日 #飲食記錄 早餐咖啡無糖豆漿450、午餐 90 克蛋白粉、鷹嘴豆蛋塔一個、晚餐聚昆布鍋,吃菜、豆腐、一碗霜淇淋,沒有吃其他碳水。
Kobo 週年慶與新的 Clara
套用 Kobo 的九週年紀念特價碼,買了如下新書:
- 日本右翼書籍《支那革命的真相》、《大東亞戰爭肯定論》
- 《張忠謀自傳》
- 《原始碼》比爾蓋茲自傳
- 匡靈秀小說《巴別塔學院》《地獄修業旅行》
- 登山肌力訓練
2025-08-17 週記
回來啦!收拾家裡,展開及歸納行李。趁著還有幾天假,趕工論文,讀一下 HRCT 的書,準備返工。另外要做的事是再添購四個 Billy 書櫃,從家裡帶一些有趣的書過來放,不要堆在家裡發霉。今年開始多看書、少滑手機,增加知識。
Notes
2025-08-11
- 01:14 新版本的 Claude,如果是部署在遠端機器上,用 ssh 的方式是不能存儲登入 token,會驗證失敗。不過還好我還可以用 VNC viewer 連進去,設定好回來繼續用 ssh。
- 01:34 連民進黨一堆女立委也跳出來討論粉底液,完全提油救火,這件事的問題在於,如果王義川有錯,也應該遵循內部評議機制檢討發言,給當事人解釋及道歉的機會;仙女團直接發文送刀給對手,還死不要臉稱教育小孩。整個黨跟賴清德 2028 大概沒救了,對外對內都軟趴趴。 #politics
- 05:12 餐廳9人以上居然要收家族聚餐的錢(一人80)。太坑了吧
- 06:01 實驗室的德克薩斯白人小弟一直把我這個鐵桿台獨台灣人稱為 from china,真是令人不爽,美國不少年輕人缺乏國際政治認知。
2025-08-12
- 04:39 回台前聚餐找不到合適的餐廳,讓 ChatGPT 代理去處理,給我選了個港式茶點 😓
- 10:42 CIV7 居然特價 30%,才開賣不到半年,太快棄守了吧
- 12:52 有時候 VS Code 死活連不上伺服器,這時候還是 Emacs 靠譜,搭配一點簡易的模組跟 Copilot,能維持最起碼的程式碼審查。
2025-08-13
- 00:05 重啟核三,靠屏東的電伺候台北的發展,為什麼?為什麼?章萬安有本事就主導在台北市蓋一個新核電廠,不然少在這邊說幹話。就這格局還想選總統 #politics
- 06:01 黃國昌這次的競選口號「一個更好的新北」是在臭前任市長們(朱候)不好嗎 😂 為什麼不用非比較性的口號例如「成為世界的新北」 「讓新北成為台灣的代名詞」 #politics
- 06:25 實驗室的資工仔喜歡搞合成報告然後叫我評估,讓 Claude code 寫了個程式呼叫 GPT-5 幫我把這事兒做完了,居然還能自動幫我把 Excel 上色。已經初步感受垂拱而治了
- 08:39 我是完全無法理解這種燃燒自己生命的行為 開業吃老本、24小時開機,「不典型」急診醫生在生命的盡頭,為瀕危病人創造奇蹟 - 康健雜誌
- 11:15 GPT Pro 訂閱下的 GPT-5 + Codex CLI 看到有人說算法導向的程式實作效率比 CC + Opus 4.1 好?沒錢買兩個同時測試 😂
- 11:33 最近嘗試把各個地方的記錄匯聚到我的 Obsidian,一口氣把本地日記直接推到 2011 年 - 可惜高中記錄佚失了。回家看以前用光碟燒錄的東西裡是否還可挖掘。Gmail 可追的最早郵件記錄是大二、PTT 的發文記錄大概都是在大一~大二。Tumblr 之前挖過一次,意外發現十來篇本地沒有記錄的部落格文,有種挖古墓發現散失文本的爽感。
- 12:00 核三辯論,可惜我心目中的反方最佳代表國昌老師還被關在地下室。
- 14:50 突然想到日記系統都遷移了,那也時候停訂 Day One 了,再節省一筆錢。
2025-08-14
- 01:47 準備轉回訂閱 ChatGPT Pro 改用 Codex,再見 Claude Max,月費制的好處就是擇善而居(當然有錢的話就是兩者都用)
- 11:46 離開實驗室前找大家吃飯,讓 ChatGPT 找可以九人、一人平均 30 元左右、距離 MUNI 或 BART 近、可在 OpenTable 上訂位的餐廳幫我下訂。最後它選了 Harborview(一家在 Embarcadero 旁邊的粵式料理餐廳)。
- 11:49 吃起來還不錯,實驗室的老闆說他去年慶生也是來吃這家。店裡的菜單其實也不全是粵菜。實驗室有人點了個北京烤鴨,但是組內有個北京來訪問的外科醫師,看到那鴨子直皺眉頭,說夾肉的料不是配餅皮 😂
2025-08-15
- 00:42 讓我猜猜,黃國昌跟傅崐萁提議的世紀大挖洞(中央山脈隧道、三公里核廢洞)的下一步,有可能是:民進黨無能只會推托台灣土木工程做不了,讓我們立法批准,好邀請世界最先進、基礎建設經驗最豐富的大陸企業進場施工? #politics
- 04:05 ChatGPT 居然會用台語量詞來指稱行李箱我快笑死 - BART 到 OAK:需在 Coliseum 轉 Oakland Airport Connector,多一次搬運,帶兩咖大箱會比較累。
- 07:53 臉書跟 Safari 是不是天然相斥,各種顯示或輸入問題從來沒解決過。
- 08:25 明天要回家啦,今晚點播一首 I Left My Heart in San Francisco I Left My Heart in San Francisco - YouTube
2025-08-16
- 20:14 這週還不用回去上班,除了搞定研究之外,還要:(1)遷戶籍到新家(2)裝濾水器(3)買 Ikea 組第二書櫃牆。
2025-08-17
- 18:38 雖然為時尚早,不過因為退訂 IFTTT 的關係,基於從 IFTTT 的 Fediverse → X 動態轉發將在 2026 六月結束。n8n 對新版 X API 設置好繁瑣哪。
- 19:38 好像完全沒什麼感受到時差,可能是平常值班很習慣這種日夜顛倒的短命作息?😂
SSD 擦洗
剛剛發現實驗室的 LLM 放射科報告分析程式會每執行一批次運算就重複寫入一整個 CSV(讀取 - 更新 - 寫入,atomic writing),但因為我在我自己的電腦跑,沒辦法跑那麼大的 batch,改成 sequential。跑了兩天,我才發現這樣改會有 SSD 頻繁寫入問題,緊急止血!檢查之後發現這玩意兒總共反覆擦洗了我的新的 Mac Studio SSD 2 TB 左右的數據!應該要套一個 SQLite 之類的,開啟 UPSERT / WAL,讓資料庫來接管數據存儲問題。
大退訂
持續在整理所有固定付費的服務的清單,發現花費實在太多了且很多不甚必要,所以進行了一波整理 - 大退訂是也。服務本身不差,只是我想盡可能增加利用率,並且釐清真實需求。
確定不續訂
- Github Copilot & Jetbrain Junie
- Github copilot 是一推出就訂的,其實對我前幾年的科研幫助很大;Junie 是前一陣子改用 PyCharm 時候看到廣告覺得不錯訂的。兩者後來也都具備了基本但有點笨的 Agent 功能
- Jetbrain Junie 其實幫我完成了我的個人放射科報告工具鏈,算是我初步的體會了什麼是與 Agent 協作 - 不過它的上下文管理能力還是略遜 Claude Code 一籌。
- 停訂的理由:自從五月底訂了 Claude Code 之後,我就再也沒有寫過程式了 - 大部分都是閱讀、修訂文檔、請求 Claude 調整。Github Copilot 有基本額度,針對單體函數做調整也很夠了,超過函數範圍的調整,我傾向於讓代理進行,速度比我自己快很多,而且可以多工。
- SetApp
- 很多實用(及不實用)的小軟體的集合,開發商自己的產品是一款 macOS 一鍵清理工具。原本是看一些生產力博主推薦裡面有的工具,看了看之後就用學生價訂閱。
- 後來發現官方轉型成大量安插 AI 工具。實際品項也沒有太大的擴充,而且我算了下,真正用的到的工具不多,按年費收還不如買斷。
- 例如:
- 標注很好用的截圖工具 CleanShotX,其實 macOS 內建的也可以做出類似的效果。
- 拖曳暫存 Yoink 有一次性付費的 macOS store 內替代品
- IFTTT
- 有點歷史的自動化工具,在 LLM 前的時代很著名,設定簡易。但是遭遇了兩次打擊 - 一次是大幅限縮免費使用者可以跑的 applet 種類及流程數量。一次是 Zapier、n8n 等複雜工作流工具搭配 LLM API 呼叫的出現;雖然 IFTTT 也推出多步流程力挽狂瀾,但好像反應普通。
- 我自己最主要的 IFTTT 使用場景是備份我的社群網站貼文;但是隨著我把流程轉向自架 GoToSocial 以及 Obsidian 串接服務後,需求降低很多。在我搞定了 n8n 部署之後,更不會需要剩餘的功能了。
- Bear
- 好看的筆紀軟體,但是功能推出的速度很慢;當年推出的時候不管是顏值、基於 iCloud 的極速同步抑或是雙鏈、標籤都很不錯。但我其實主力筆記工具已經轉向 Obsidian 很久了,各種雜記或網頁備存則用蘋果本家的 Notes,搜尋更方便。
- Blink
- 本來是想說會在 iPad 上連線寫程式什麼的,結果發現根本是偽需求 - 平常上班根本沒空寫、就算要展示也會帶著筆電,而且內建的 VS Code 居然不能使用 remote connect,這樣就沒意義了。果斷退訂。
- 我個人覺得 iPad 最適合的還是圖片影片現場編輯調整、繪圖等藝術文創生產力。寫程式要用 iPad 做生產力還是太早了。據說 iPadOS 26 有很大的更新,插上大螢幕後可以視窗化。不過 store 內的 iSH 一樣可以遠端連線,似乎沒有特別需要。
- Update 2025-10-06 後來因為發現在平板監看、操作 Claude Code 其實不差,所以又訂購回來了;iSH 停止更新甚久,功能也不太穩定。
- 1Password
- 今年就已停訂,轉移到蘋果生態系 Passwords,整合更好。唯一的考慮是如果蘋果主帳號出問題,下面的密碼有機會全部完蛋。
- Day One
- 日記軟體,有 IFTTT 結合功能,我之前是拿來備份社群服務的發文。不過正如 IFTTT 條目所說,因流程變更,用不到了。
- Halide Mark II
- 可以拍 RAW 格式的相片。當初訂閱是因為有在爬山,想說拿來拍一些風景美照什麼的,但後來發現我出外景的次數越來越少、日常拍照用處不大,蘋果現在也有自己的 RAW 格式可以選擇。
- Goodnotes
- 手寫筆記軟體。我有一陣子晨會筆記喜歡通過手寫的方式進行;跟學弟妹說明注意事項的時候手寫也很方便。但是後來還是用打字的方式為主
- Heptabase
- 極好的筆記軟體,我很喜歡也很佩服詹雨安對知識體系構築的想像,但因為我大部分筆記的都是醫學內容或研究日誌,維基式樣的互聯已經足夠,不需要這種視覺連結。本來想說讀論文的時候或許可用,但還是不如直接做在 PDF 以及論文管理軟體內(目前是 ReadCube)。
考慮停訂
- Proton 系列
- Proton mail 是很有名的「不作惡」基於瑞士的信箱服務。其實使用上沒什麼大問題,但是要價不菲,而且 app 十分難用(只要沒有網路就無法讀取)。VPN 偶爾會用,但其實我現在有 Tailscale exit node,我可以轉發流量到我家裡的電腦或日本伺服器,實際上並不需要。
- Proton calendar、pass、drive、wallet 目前基本上用不到
- Kagi
- 無廣告、可自訂的搜尋引擎,我設定了優先顯示放射科學相關網站,這樣搜尋疾病就不會跳到某些衛教網站(例如 WebMD)。
- 最近的搜尋習慣變成從 ChatGPT 詢問並整合,Kagi 使用頻率大幅降低,加上平日搜圖的機會也不低,Kagi 在這部分的表現差強人意,導致我還是有很大比例使用 Google。
- Disney+
- 單純就是沒那麼多時間看影片。也許可以為了辛普森家庭暫時繼續留著。
2025-08-10 週記
預測 TGA 2025
- 年度遊戲、音樂、美術、獨立遊戲:33 遠征隊
- 指導、敘事、角色扮演:死亡擱淺 2
- (角色扮演我覺得也有可能是天國降臨 2)
- 最佳演出:Higgs 的演員 Troy Baker
推薦 Reddit
最近喜歡泡在 Reddit 上,特別是一些諸如 homelab、meshtactic 之類的小型技術網站,令我感興趣的貼文相較於 Twitter 密集,畢竟在 Twitter 追縱的是人而在 Reddit 上是主題。然後再關注幾個高品質的新聞或聚合網站充當隨機性來源,例如我是 HackerNews 搭配華爾街日報,基本上科技及政治大事就都有了。
所謂隨機性來源是打破同溫層的意思。不過政治上的「非同溫層」我興趣不大,主要還是平常沒接觸到的電玩作品或有趣的科技產品。Reddit 上的電玩社群我倒是沒有加入,最主要的原因時候很多人會在上面問攻略。
試玩 GPT-OSS
用 GPT-o3 上網搜尋論文再生成了一些困難的醫學知識問題 - 大部分都是次專科等級的(間質性肺病、孕婦自體免疫) - 來看看 GPT-OSS 120B 的程度如何。結果所有問題都可以答對 - 而且可以具體指出是哪個 trial。這個知識量跟 recall 的能力真驚人!遠遠超越當年的 GPT-3.5,而這樣的模型居然能輕易的跑在我的 Mac Studio 裡面。
是說 GPT-5 也是這週發佈。劇本運作的速度比 AI 2027 預估的還快,每兩個月就有一批新的、可怕的工具出現,比方說:
- ChatGPT deep research 是二月才發布的(Gemini 則是一月多)
- Codex 跟 Claude Code 是五月發布的(CC 二月是預覽版)
- GPT-o3 是四月發布的,四個月後隨即被 GPT-5 掃入歷史的垃圾桶
當然有人拿一些 LLM 至今似乎還沒辦法克服的軟肋去表達「模型錯誤很多」。例如要模型去算求解 5.9 = x + 5.11 這一類的問題。我個人覺得沒有什麼意義,LLM 的架構就是那樣,你不可能要一個 Transformer 展現全部的人類智能;我個人認為主要進步還是讓 LLM 可以編寫外部程式處理這些問題,例如數學計算或圖像計數、OCR 等問題。