如果在一個沒有網路的小鎮,一個讀書人,要利用鎮上唯一一間只有紙本、沒有電腦的圖書館,9小時限定,規劃出一本論文的寫作方向與參考書目,你做得到嗎?
我自己寫論文的時候拖到修業年限的最後一年,很勉強地才把論文擠出來,所以我承認我做不到,光是沒有電腦可以查詢館藏就難倒我了,更別說沒有網路。因此看到《玫瑰的名字》、《傅科擺》的作者安伯托‧艾可(Umberto Eco),曾經給自己設下一個這樣的挑戰時,我懷著考古的心情非常好奇要如何辦到。
艾可其實先是個學者,才是個小說家,因此他在 1977 年出過一本《如何撰寫畢業論文》,好像也不是什麼奇怪的事。我前面提到的任務,就出現在這本《如何撰寫畢業論文》中。
不插電的知識整理術
如果期待《如何撰寫畢業論文》是一本虛實交錯的小說,打著寫論文但其實是艾可炫技、大展博學的讀者,我不得不在這裡打破幻想,它是一本不折不扣的教學指南,非常仔細地教導如何完成一篇論文,細到連標點符號、大小寫、定冠詞、重音標示(畢竟原文是義大利文)都有,中文版還不得不跟義方出版社討論刪除這些有文化差距的章節段落。書本的內容架構,就是從選擇論題、搜尋資料、製作工作計劃與索引卡片和寫論文一路發展下來,非常適合碩士一年級生在日後淹沒書堆之前,先武裝自己的絕佳武器。
這本書寫在上個世紀的70年代末,當時連 IBM 開放式架構的個人電腦都還沒誕生,論文要手寫完成後請人打字完稿的年代,學習本身需要許多的苦工。大概是當時的學生常常抱怨自己的圖書館資源不夠多,沒辦法寫好一篇論文,於是艾可抱著懷疑的態度想驗證這個命題。他虛擬了一個資源很少的地區圖書館,並給自己設定三個下午總計9小時的時間,設定他自己不甚熟悉的題目,看看自己最後能完成什麼樣的工作。
他在亞歷山德里亞找了一間最接近他設下條件的地方圖書館後開始工作,詳細地依自己的論文寫作方法,羅列他如何開始翻找主題索引的圖書目錄(年輕的讀者很難想像,以前的圖書館會有這樣的紙本書,你可以找「美學」、「隱喻」,然後就可以看到有館藏有哪些作品),找到相關的書後,從裡面翻找參考書目。他再找了相關類型的百科全書,當中也會列出相關的作者與著作。過程中他一邊手寫書目卡片,一開始整理出 38 張書目卡片,而其中館藏有 25 本,將近 70% 的成果,艾可覺得還不賴。
找出的這些書,又會繼續衍生出更多的書本出來,有些已經出現在之前的書目卡片中也很正常,但更長的書單不斷增長出來,這過程中他必須要考慮有限的時間,以及和論文主題的切合度進行篩選,以避免書目不斷增長,甚至出於必要,也要思考一下原本論文主題的方向。最後他得到的是300本的書目清單,以及確認有 30 本左右的館藏和可操作的論文主題。
艾可的結論是「可以在某個議題幾乎一無所知的情況下,花三個下午的時間到地方圖書館整理出足夠清晰且完整的概念」。
沒有現代科技如 Google 搜尋引擎、線上資料庫、Zotero 等知識輔助工具不是艾可的有意選擇,而是那個時代原本就還不存在,但也因此剛好給了我們一個考古的機會,了解即便沒有這些插電工具,一樣可以做好學問。
把時間拉回到大 AI 時代,AI 驚人的知識吞吐量帶來了革命性的改變,現代人只需打開 Google Deep Research,前後大概不用 9 分鐘,獲得的結果也許會比大師的手工藝更為全面完整。從效率來看,9分鐘絕對大勝9小時,你可以透過現代工具輕易打敗義大利符號學大師,但這樣打敗的意義究竟是什麼?我們抱台電腦打開AI就個個都是鴻儒,往來無白丁了嗎?
神奇的自動化第二大腦
Andrej Karpathy (前 Tesla AI 總監、OpenAI 共同創辦人) 4月初在推特上分享了自己的知識管理工作流,沒想到引發大量的討論甚至試作,一時之間人人都在聊 LLM 個人知識庫,或是 LLM 版的第二大腦。
Karpathy 碰到的問題就跟大家一樣,AI問答是沒有累積性的,你透過 AI 拿到答案之後知識就斷在那裡了。接下來你可能需要把這些問答的結果貼進筆記軟體或是儲存檔案,之後再透過搜尋等方式找出來使用。過程不但繁瑣、再利用性也令人打上問號。
為了解決這個問題,他讓 LLM 扮演主動的知識整理者,把原始資料預先編譯成有結構的 wiki,而不是每次查詢時再從零拼湊答案。
在資料搜集階段,不管是文字或圖片,他都丟進了特定的資料夾,利用 LLM 能讀取、辨識的能力,自動整理成 wiki 形式的 markdown 檔案,並且形成了必要的摘要、反向連結、分類等。
當這些資料累積、編譯成wiki檔案到一定量、自成體系後(他自己說是 40 萬字左右),他認為已經煮成熟飯,開始利用 LLM 也很擅長的問答進行探索。而問答過程獲得的知識或答案,可以再回到上一個階段,形成新的有效知識。由於這樣的文字量仍在 LLM 游刃有餘的程度,所以完全不需要額外的資料庫或是 RAG 技術。
另外他還利用 LLM 作知識的健檢與修補,驗證資料或知識的矛盾之處、補完缺失的資料,自動完善資料。
Karpathy 的 LLM 知識庫除了因為是大神發言而受到注目,更重要的是他的方法簡單粗暴,從輸入到輸出,用到的工具和方法,幾乎也都是一般人可以運用。透過搜集、編譯、檢查,形成一個能自主生長的個人知識庫,之所以強調個人,也是因為外面的 LLM 沒辦法為你量身訂作,即便你的資料都是網路而來,但是跟完全專注在自己特定的範疇,成果仍然有落差。
更不用說和一般的筆記軟體的個人知識庫相比,那些軟體往往只能作資訊的大量囤貨,沒辦法形成知識流動。
Karpathy 的 LLM 知識庫解決了真實的痛點,網路上短短期間上千萬的熱烈反應也說明了一切。但是一個優秀的第二大腦工作得很好,就代表那顆脖子上的第一大腦就會跟著變好嗎?
第一大腦需要餵養模型
在 Jeff Hawkins 的《千腦智能新理論》這本新近研究作品中,主張新皮質的機制是學習世界的模型,而我們的大腦無時不刻在進行預測與檢核與我們腦中的模型是否一致。一旦出現預測落差時,就會引起我們的注意,這時我們就會修正、更新我們的模型,以便進行之後的預測。
模型的概念就像當你看到人生的第一個按鈕,有個突出的地方,按下去之後,可能會發出聲音或是燈光明滅,於是你學到這樣一個抽象化的概念,之後即便顏色、大小、作用不同,但你都能認知這類東西叫按鈕,而且都會想要按一下。所以當我們腦中的概念越多,我們就越能越快預測與認知,模型越多,你也越能理解複雜的概念。
知名投資人查理‧蒙格也有類似的看法,他認為人必須有足夠多的思維模型,才能正確地理解與判斷,光是硬記一些資料是沒有意義的。他心中大概有80-90種思維模型,包括心理學、數學、邏輯還有一些常見的思維法則,這些才能讓人在思考時不會成為單向度的人。
如果我穿越到上個世紀70年代,和艾可一起坐在那個圖書館裡,當然沒有 Google Deep Research可以用,只用9個小時,我絕對沒有辦法像艾可做到那麼豐碩的成果,即便讀過《如何撰寫畢業論文》可能會好一點,但絕對無法等量齊觀。
如果逆向操作,把艾可拉到我們這個大 AI 時代,我們兩人同時「預備~起!」用9分鐘找資料,我仍然相信艾可最後呈現的知識一樣可以擊敗我,毫無懸念,他腦中已經內建有太多的思維模型了。
在要當AI咒術師或是軟體手工職人這篇文章中我提到韓國的金炳完,他在三年內讀完1萬本書之後出關,2年內寫了50本書之外,還推出了「量子力學閱讀法」,結合坊間的速讀技巧和他個人 know-how,宣稱學會後可以達到5倍的閱讀速度或是一目一頁的高效成果。如果這個技巧屬實,我覺得金炳完很可能倒果為因,他是因為腦中已經置入了無數的思維模型與資料,因此當他掃讀一般的書,大概就能辨識出是否有需要留意的資訊(預測!),因此他的量子力學閱讀方法,終究只適用像他這樣擁有無數思維模型置入後才有用。
希望人類未來仍是維特魯威人的形態
我在推特上每天都會看到許多精進 AI 用法的討論,不管是讓它變得更聰明、更好用、更聽話,更自動;因為往往立竿見影,所以大家都非常願意花時間在上面。
對Karpathy的第二大腦工具我像其他熱愛知識的人一樣也會躍躍欲試,但即便 LLM 知識庫創造了第二大腦的低摩擦,這樣的系統終究位於你的大腦之外,無論餵了多少資料、如何的自動化、如何會「思考」,終究不是你的大腦,第二大腦定位終究無法代替你,他只能幫助你。
也許遙遠的未來,人類大腦用進廢退,人類的頭部只剩小小的一顆,符合人體節能的傾向,也許看上去會更像基因與人類有將近85%重疊的老鼠。但我比較希望人類可以像達文西那張《維特魯威人》一樣,那個大腦的比例好看一點。
在大AI時代,學會使用第二顆大腦固然重要,但我更希望能有個如同艾可一樣不怕停電、隨時帶在身上不會掉的第一大腦。