知識萃取

知識萃取是什麼?如何將內隱知識轉化為系統流程?

你有沒有發現:腦子裡明明有一堆經驗,但一問你怎麼做的,卻說不出個所以然?

這就是為什麼你需要「知識萃取」。

所謂知識萃取(Knowledge Extraction),不是把資訊從網路上複製貼上,而是把你腦中那團模糊又雜亂的經驗 —— 抽絲剝繭地整理、命名、轉化,變成一個清楚可複製的知識體系。

就像你從一鍋混沌的湯裡,撈出最精華的那一瓢;或像把一整本書,濃縮成一句讓人秒懂的筆記。

更簡單的比喻是:你手上有一瓶「顯影劑」,可以把那些原本藏在你腦子深處的「內隱知識」,顯現出來。讓別人看見你是怎麼想的,怎麼做的 —— 如此一來,他們就能照著你這套方式,從 0 → 1 複製出同樣的成果。

我覺得「知識萃取」是知識工作者必備的技能。

你要是學會了 —— 那你之後不管是要寫書、開線上課程或是到別人企業上課,都很好用。

知識萃取是什麼?

知識萃取,如果用比較學術上的定義 —— 把原本隱藏在「雜訊」或「大資料」裡的、有用且可重複利用的知識,抽取並結構化的過程。

知識萃取 ≈ 將混亂的資訊「整理、濃縮、標記」成可用知識的過程

但這定義我覺得不好理解。

我自己的理解是,知識萃取,就是想辦法讓別人能夠複製你的行為。

就像做菜需要按照食譜一樣,第一步要做什麼、第二步要做什麼,每一步要注意什麼,從0到1的整個過程都交代清楚 —— 前期備料有哪些、每個階段有哪些重點、會碰到哪些關卡,要注意哪些陷阱,全都列出來,而你在統整這流程的過程,就叫作知識萃取。

所以知識萃取,你不用記住他的定義,你就想像成你在編一份「食譜」,讓人可以從0到1,照著你的方式,複製你的行動就好。

知識萃取該怎麼做?

我腦中對於知識萃取的定義很簡單:我有沒有一種「我完全懂了!」的感覺。

那麼完全懂是什麼意思呢,或說我的把握依據是怎麼來的呢?

以我自己為例,我只有將一門知識製作成課程的時候,我才有「我完全懂的感覺」—— 搞懂的意思是,對於那領域來說,你知道頭和尾在哪裡,整張地圖一覽無遺,並且你知道中間會經過哪幾個環節,而在經過那些環節時,會遇到什麼挑戰或災難,而又要怎麼解決那些挑戰。

所以簡單來說,搞懂的定義就是,你能確保自己從0走到1,並且中間會遭遇的每個關卡和知識點你都了然於心。

以流程看,知識萃取我會列 4 大流程:

  • 1.先畫一張大地圖,把「起點」和「終點」標示清楚;
  • 2.把 0 到 1 會經過的路徑,也一一按順序標示;
  • 3.檢查每一個關卡節點,看看它所涉及到的知識點有哪些;
  • 4.打補丁。補足知識點,或是檢查每個節點下的「二階效應」。

由於知識萃取確實不好理解,所以我下面的舉例,都會以「煮菜」當作例子。

第1步:定義目的

第一步,我們得先畫張大地圖,標示出你的「終點」在哪,這樣才好「以終為始」的思考,中間的路線點為何。

也就是說,結尾會影響你中間的操作流程

我有時候在比對我和他人的知識體系有什麼區別時,為什麼他的步驟長這樣,而我的步驟卻是長那樣,我發現到差異點往往是來自於更上層的「目的定義」不同。

亞里斯多德曾說:每一個事物都有一個第一性的概念,就是「目的性概念」。這個事物存在的目的是什麼?

例如,你要煮菜,同樣是一根雞腿,你煮給成年人吃的目的是「好吃」;煮給嬰兒吃的目的是「健康」。兩者是不同的。

  • 你的「流程」會怎麼編排,是取決於你的「目的」;
  • 你的「目的」會怎麼編排,是取決於你的「目標對象」。

接著,根據這個目的性,推導出你行動上的「必然性」是什麼,也就是在這個目的驅動下,你非做不可的事情是哪些。

這對應的是你的操作流程。例如:

  • 煮給成年人吃,要好吃,得炸,所以你得醃製,裹粉;
  • 煮給嬰兒吃,要健康,得蒸,所以不能加添加劑,要保持原味。

我再舉個得到 CEO 脫不花的例子。

得到有一個客戶,他們要在公司大堂做一個展版,跑來問脫不花這個展版做的好不好?

而脫不花看完後,不是張嘴就給意見,而是先問一個問題:你們要在大堂裡做展版,這個展版做的好不好,最重要的是要確定這個展版是幹啥用的?

脫不花進一步分析:

如果說是做給員工看的,那員工每天上班急死了,都趕著點進門,誰有閒工夫在大堂看公司宣傳。如果真要給員工看,就應該放在食堂裡,而且是放在排隊的地方,這樣大家沒事就能看一看。

所以,展版要放在大廳,就證明不是給員工看的。那給誰看阿?給來訪的客戶看,好,既然是給客戶看,那內部信息就可以全部拿掉。

哪個客戶要看你們公司 100 多條發展史阿,不可能的,可以簡化成 10 條。哪10條?肯定是跟客戶有關的 10 條。

下一個問題,為什麼要在大廳裡做個展版給客戶看呢?希望它幫我們傳播唄,最好能拍照照合影。要拍照合影,那你為啥設計成這個樣子,小圖片、小字,你放那麼多字,這樣拍的照片還能幫你傳播嗎?所以字得少,得大。

所以「目的性」,是知識萃取的一切源頭,如果你沒想清楚,那你後面也不用做了,多做多錯。就像我前面說的,我在對比我跟他人的知識體系時,為什麼他的過程是 A,而我的過程是 B,就真的是目的上的不同。

或說,是想給學生帶來的最終效果不同。就是說,你決定的目的,會決定把學生帶往何方。

一個精準的目的,可以帶到正確方向,而一個錯誤的目的,就帶往錯誤的方向。

學習成果就會是天差地別。

第2步:標示過程

明確目的性和料理手法後,第二步,我們要標示中間過程。

在標示中,可以先畫成「大過程」。

例如煮菜,大過程可粗略劃分成:「前期備料」、「開始烹飪」、「擺盤」。

接著再將大過程細分成小過程。

例如,「前期備料」裡又可以劃分成多個小過程:「醬料準備」、「食材準備」……。

以剛剛雞腿的例子,在目的性考量下,成人要好吃,得炸;嬰兒要健康,得蒸,將其拆開如下:

大人向的台味胡椒鹹酥風(要醃製、裹粉、油炸):

  • 1.雞腿剁塊,去血水
  • 2.醃漬(取大碗,放入醬油、米酒、蒜末、白胡椒、五香粉、鹽)
  • 3.二段裹粉
  • 4.油炸(初炸,靜置,再複炸)
  • 5.瀝油裝盤

嬰兒向的蘋果胡蘿蔔甘甜風(要去脂肪、混果泥、清蒸):

  • 1.雞肉去筋去脂,切小丁,去血水
  • 2.製作果蔬泥(蘋果、胡蘿蔔、洋蔥)
  • 3.混拌(無鹽、無糖)
  • 4.清蒸
  • 5.等冷卻裝盤

同樣一根雞腿,由於目的性不同,料理過程也會截然不同。

標示過程是一件很麻煩的事情,因為這代表你想清楚了你「從0到1」的每個階段。知道了:

  • 中間一共有哪些步驟
  • 每個步驟之間,正確的銜接順序為何

這件事很不簡單,能用文字把流程條列清楚的人是少數的。大多數人可能事情他都會做,但都是憑經驗做,你問他為什麼,他也說不出個所以然來,屬於內隱知識,無法外顯呈現在紙面上,也無法傳遞給他人。

這就是為什麼我會以食譜做舉例,因為食譜是最容易標準化的,只要給好步驟,和所需要的食材,複製的成功率很高。

但其它領域,比如做業務,一個老手能成交一個客人,可能真的就是靠直覺 —— 看過幾百個客人了,能從一些肢體語言或微表情中找到蛛絲馬跡,可能在他大腦都沒反應過來時,身體就已經發來訊號了,遇到項目快搞黃時,就讓他胃痛……

但他要教新人時,總不能說,辨別指標就是看胃痛不痛吧,因為這只適合他自己而已……他得抽出更為客觀(可觀測、可量化),讓他人能夠理解的判斷標準。

就是簡單來說,做業務的大步驟可能有:

1.客戶辨識 → 2. 建立信任 → 3. 需求探詢 → 4. 方案提案 → 5. 異議處理與成交 → 6. 售後關係經營

然後在辨識階段時他不能寫:

「如果我一靠近這位潛在客戶就開始胃痛,那多半成交機率不高」

而是要改為:

「觀察客戶是否出現視線游移、身體後仰、頻繁看手錶等退縮型肢體語言」

第3步:考察關鍵定義

把每個關卡都一一列出之後,第三步,是依序檢查每一個關卡節點,看看它所涉及到的知識點有哪些。

比如說現在這個關卡是「炒菜」,那這個關卡會涉及到火候的掌握:火要不要先開大火,先熱鍋,還是用小火?這時候材料要不要先放?油要燒到什麼程度才下鍋?這些都是關於「炒菜」這個關卡所對應的知識點。

再來,辨識出知識點之後,要看這些知識點有哪些門派。

比如說備料裡的「切」,那切菜到底是橫著切、縱著切,還是斜著切?各派的說法是什麼?優劣在哪裡?這時候就要統整各方的論點,然後從中得出一個你覺得最能說服自己的說法。

再以剛剛的大人向的台味胡椒鹹酥風舉例:

  • 1.雞腿剁塊,去血水
  • 2.醃漬(取大碗,放入醬油、米酒、蒜末、白胡椒、五香粉、鹽)
  • 3.二段裹粉
  • 4.油炸(初炸,靜置,再複炸)
  • 5.瀝油裝盤

以「裹粉」的關卡來說,會涉及到很多的知識點。例如:

  • 粉類選擇:是要地瓜粉、太白粉,還是低筋麵粉?
  • 粉粒粗細:是要細粉薄脆,還是要粗粒有咬感;
  • 一次裹粉 vs. 二段裹粉;
  • 調味粉加入時機:白胡椒、五香粉、鹽是直接拌入粉中,還是另撒表面提味;
  • 裹粉後靜置時機;
  • ……

然後假設,關於粉類選擇,阿基師說要用地瓜粉、詹姆士說要用低筋麵粉、王剛又說要用太白粉……

那根據這些大師們的觀點,你得擺在一起辯讀,思考為什麼他們會這麼說,他們的目的為何,前提條件是什麼,而你的目的又是為何,哪一種解釋在你當前的情境下才是最適合的?

你得有些複雜思維,知道事情不是都非黑即白的,而是要看情境使用的。釐清使用情境,某方面來說就是讓你的思考顆粒度更細一點。就像樹枝開岔一樣,一般人的理解程度只到粗樹幹,而你能理解分岔再分岔後的小樹枝。

也就是說,你要進一步拆解——這句話是在哪種情境下才成立?背後的假設是什麼?會不會換一個食材或料理方式,它就不再適用?當你能這樣分辨細節與條件,你才不會只是把大師的話當作教條。

第4步:打補丁

當你對每一個知識點做「概念考察」,也就是在特定時機、特定情況下,哪一種解釋才是最適合的後,第四步為「打補丁」。

打補丁涉及到兩個概念:

  • 補足缺失的流程或知識點;
  • 對原有知識點多思考一步,看實行時會不會延伸出其它問題。

先來講第一個,補足缺失的流程。

由於你可能是第一次做「知識萃取」。你會發現原來這份地圖是不完整的,有很多破口。可能要有 9 個步驟,但你只懂其中7個步驟,那你就得回頭看書去補足這兩個你不熟悉的知識。

有意思的是,「你知道自己不知道」會是在把地圖攤開畫出來後才會知道的。因為以前你從來沒定義過這些概念或是沒審視過這些流程。所以地圖上都是「戰爭迷霧」,而當你知識萃取後,你才會發現,原來哪些概念我是懂得,有把地圖點亮的,而哪些概念原來我一點都不懂,導致知識脫節,少了步驟 4,所以步驟 3 和步驟 5 沒法連接起來。

比如酥炸雞腿:

  • 1.雞腿剁塊,去血水
  • 2.醃漬(取大碗,放入醬油、米酒、蒜末、白胡椒、五香粉、鹽)
  • 3.二段裹粉
  • 4.油炸(初炸,靜置,再複炸)
  • 5.瀝油裝盤

也許醃製完後,要再多加一個「滷」的過程,得先滷它個一天一夜,這時候再裹粉炸,肉才會入味。那這個滷的知識點是以前從來沒接觸過的,就得回頭學。

接著,打補丁的另一個概念,叫做「二階效應」。

所謂的二階效應,是指你當下所做的這個行為,除了會直接產生一階的後果外,這個一階後果還會繼續延伸發展,甚至反過來對整個系統產生新的影響,進而導致二階後果。而這種二階後果,往往是你當初沒有計畫到的。它通常帶有滯後效應,讓你在短時間內察覺不到,但過了一段時間,你才會開始看到真正的結果。

例如,很多人解決問題的視角是 —— 「頭痛醫頭、腳痛醫腳」。

像是小朋友愛玩遊戲不讀書怎麼辦?

第一直覺就是把遊戲刪掉就好,或是限制小孩使用電腦。但問題有解決嗎?沒有,所謂上有政策,下有對策。他在家裡沒法玩,還能到網咖或是到朋友家玩,或是轉為看 tiktok、動畫、韓劇……他一樣是不會把時間拿去唸書。

其根本問題還是沒有解決。

所以說,在思考知識點時,還要進一步思考「二階效應」:你採用的這個解法,是否可能引發後續問題?如果有,那你準備怎麼處理、怎麼補救?

  • 問題點:小孩把讀書時間都拿去打電動
  • 解決方式:遊戲刪掉
  • 一階後果:小孩暫時失去遊戲來源 → 空出時間
  • 二階效應:小孩轉去網咖或朋友家玩,甚至對父母產生逆反心理 → 親子關係惡化。

洞悉背後真正意圖:打電動只是你表面看到的現象而已,但你沒看到他為什麼要打電動的背後動機。比如他可能是學習壓力太大,或是上課時被同學欺負等等,很需要一個發洩的管道。並且打電動也不是你真正在意的目標,你只是因為他花太多時間打電動而壓縮到唸書時間而已,你真正想要的目標是要他好好唸書,提升成績。

真正的問題是,你要怎麼讓小孩把注意力重新放回讀書上。

  • 補丁:就跟他約法三章,讓他功課先做完,剩下的就是他的自由時間了。他想怎麼玩就怎麼玩。

這就是對二階效應的預判與補全。

而通常二階效應光靠腦子是想不出來的,得實作才行。在做的過程中,才會慢慢覺察原來當時還有哪些風險是有疏漏的。

像是 Paul Graham 在〈Startups in 13 Sentences〉就說道:「快速推出產品的理由,不是因為提早進入市場有多關鍵,而是因為在你推出產品之前,其實你根本還沒開始真正工作。推出的過程會教你,自己應該要打造的是什麼。在此之前,你都只是在浪費時間。」

所以如果將前3步,當作是搭建「知識體系」的最簡框架。

想像成是你自創武功。

那這第四步,就是下山歷練,去驗證這套體系是否真的成立的時候了,就是跟他人比武,用各種手段驗證原有的體系。

如何評判「知識萃取」優劣

那當你萃取完知識後,你要怎麼判別優劣呢?

就是以「別人能否復刻」作為標準。

我前面提到,你不用記住知識萃取的定義,你就想像成你在編一份「食譜」,讓人可以從0到1,照著你的方式,複製你的行動就好。

所以這問題改成這樣會比較好理解 —— 如果有兩個人編寫食譜。為什麼其中一人所編寫的,能讓人做出米其林水平,而另一人的食譜卻會讓人炒糊呢?

他們之間有什麼差別?

我覺得關鍵是在「食譜的細節顆粒度」和「對“意外情況”的預判」。

1.把「模糊的經驗」轉化為「可量化的動作」

原料要「精準到克」,避免「適量/少許」的模糊表述。

  • 錯誤表達:「加鹽少許,炒到差不多有香味就行。」
  • 正確表達:「加入海鹽 2 g+白胡椒粉 0.5 g,改中火翻炒 45 秒。」

2.標注「適用場景」

同樣一道菜,煮給自己吃和煮給部隊裡100多人吃,料理手法是不同的。沒標註適用場景,就沒可用性。

  • 錯誤表達:「把所有材料一起丟鍋裡煮 10 分鐘就好。」
  • 正確表達:「家用 2 人份:小火燉 10 分鐘。」

3.寫清「關鍵步驟的底層邏輯」

要解釋「每個步驟的“為什麽”」,否則學習者只會“照做”,不會“變通”。

  • 錯誤表達:「先過油再炒,味道比較好。」
  • 正確表達:「先以 170 ℃ 熱油 15 秒快炸,可迅速封住雞肉表面蛋白質,鎖住肉汁;再回鍋翻炒才能保持內嫩外酥。」

4.提前預判「可能出錯的地方」

預判“學習者可能在哪里踩坑”,並給出“急救方案”。

  • 錯誤表達:「油炸到金黃就撈起來。」
  • 正確表達:「油溫必須保持 170–175 ℃;若筷子插入油面無氣泡,表示溫度不足會導致回軟;若油面冒白煙則溫度過高,易焦苦,需立即調小火。」

5.包含「個人化調整建議」

同樣的食譜,台南人會加糖,四川人會加麻椒 —— 知識萃取也要允許「根據個人情況微調」,畢竟沒有“適合所有人的完美方法”。

  • 錯誤表達:「照這個醬汁比例做,人人都好吃。」
  • 正確表達:「偏甜口味:額外加蜂蜜 5 g;低鈉需求:醬油減半並以檸檬汁 3 ml 補酸度;重麻辣口味:增花椒油 2 ml。」

6.加上「效果檢驗標準」

如何判斷自己「學會了」,有沒有什麼指標?

  • 錯誤表達:「味道差不多就可以起鍋。」
  • 正確表達:「外層敲擊發脆聲、色澤均勻金黃;中心溫度 ≥ 75 ℃、切開無血水、肉汁透明,即視為完成。」

知識萃取跟一般「整理筆記」、「寫心得」有什麼不一樣?

關鍵差別在於:「輸出的目的性」與「可複製性」。

許多人在讀完一本書或上完一門課後,會做筆記、寫心得、甚至分享學到的重點,但這些動作大多停留在自我反思的層級 —— 例如記錄我學到了什麼、有什麼啟發、我同不同意作者的觀點。

但知識萃取的重點不在於你自己「吸收了什麼」,而在於你是否能夠把這些內化的東西「轉譯成他人能照著做的操作步驟」。

換句話說:

  • 心得筆記:我覺得這觀念很重要,對我很有幫助。
  • 知識萃取:這觀念背後是什麼邏輯?要讓別人用出來,需要什麼前提條件?可以拆成哪些步驟來執行?如果失敗了,可能是哪個環節出錯?該怎麼調整?

簡單來說,知識萃取的最終產物不是「看起來很有感的文字」,而是一份可以被他人實際應用的「操作說明書」,就像你在教一個剛學煮菜的學生 —— 你不能只說「炒到香就好了」,你要說明:

  • 怎麼判斷「香」?
  • 用什麼鍋?多大的火?多少油?
  • 食材先後順序?
  • 有什麼常見錯誤?
  • 有沒有變化版可以選?

也正因如此,知識萃取更像是「知識工程」—— 讓他人可以從沒經驗的彼岸,靠著你整理出的這套步驟,跨過河,走到成果的彼岸。

會知識萃取的人,就是能把這些「內隱能力」轉譯為「外顯步驟」的人 —— 能拆解出這整套隱形的運作機制,變成人人可學、可套用的系統。

相關文章