跳到主要內容
AI 101 — 人工智慧入門
2

大語言模型的秘密 — AI 怎麼寫出文章?

字體大小18px

LLM 就像史上最強的接龍王

你知道文字接龍嗎?你說「太陽」,朋友接「陽光」,再接「光明」... 大語言模型(LLM)就是這樣!它讀了整個網路的文字,學會了什麼字後面最可能接什麼字。當你問它問題時,它就一個字一個字「接」出回答。

什麼是大語言模型?

LLM 的全名是 Large Language Model(大語言模型)。

  • 大(Large):指模型有非常多的「參數」,像是大腦裡的神經連結
  • 語言(Language):專門處理文字
  • 模型(Model):一套數學公式

ChatGPT、Claude、Gemini 都是 LLM。

Token:AI 的最小文字單位

AI 不是一個字一個字讀的,而是把文字切成小碎片,叫做 Token

AI 怎麼一步一步寫出回答

拆解(Tokenize)

把你的問題切成一個一個小碎片(Token)。例如「今天天氣好嗎」會變成「今天」「天氣」「好」「嗎」。

理解(Encode)

預測(Predict)

重複(Repeat)

「大」到底有多大?

模型的參數就像大腦裡的神經連結。參數越多,AI 能記住和理解的東西就越多。

  • GPT-3:1,750 億個參數
  • GPT-4:據說超過 1 兆個參數
  • 人類大腦:大約 100 兆個神經連結

填填看

LLM 的全名是(大語言模型)
AI 把文字切成小碎片,這些碎片叫做
AI 寫文章時,每次預測下一個最可能出現的,然後不斷重複

為什麼 AI 有時候會說錯話?

AI 有時候會很自信地說出錯誤的答案,這叫做 幻覺(Hallucination)。就像一個學生考試時不確定答案,但還是很有自信地亂寫一個。

排排看!

排排看

把 AI 回答問題的步驟排成正確順序

  • 組合成完整句子
  • 預測下一個 Token
  • 計算 Token 之間的關係
  • 把問題切成 Token

隨堂測驗

1 / 3

LLM 寫文章的方式最像什麼?