AI 101 — 人工智慧入門
第 2 課
大語言模型的秘密 — AI 怎麼寫出文章?
字體大小18px
LLM 就像史上最強的接龍王
你知道文字接龍嗎?你說「太陽」,朋友接「陽光」,再接「光明」... 大語言模型(LLM)就是這樣!它讀了整個網路的文字,學會了什麼字後面最可能接什麼字。當你問它問題時,它就一個字一個字「接」出回答。
什麼是大語言模型?
LLM 的全名是 Large Language Model(大語言模型)。
- 大(Large):指模型有非常多的「參數」,像是大腦裡的神經連結
- 語言(Language):專門處理文字
- 模型(Model):一套數學公式
ChatGPT、Claude、Gemini 都是 LLM。
Token:AI 的最小文字單位
AI 不是一個字一個字讀的,而是把文字切成小碎片,叫做 Token。
AI 怎麼一步一步寫出回答
拆解(Tokenize)
把你的問題切成一個一個小碎片(Token)。例如「今天天氣好嗎」會變成「今天」「天氣」「好」「嗎」。
理解(Encode)
預測(Predict)
重複(Repeat)
「大」到底有多大?
模型的參數就像大腦裡的神經連結。參數越多,AI 能記住和理解的東西就越多。
- GPT-3:1,750 億個參數
- GPT-4:據說超過 1 兆個參數
- 人類大腦:大約 100 兆個神經連結
填填看
LLM 的全名是(大語言模型)
AI 把文字切成小碎片,這些碎片叫做
AI 寫文章時,每次預測下一個最可能出現的,然後不斷重複
為什麼 AI 有時候會說錯話?
AI 有時候會很自信地說出錯誤的答案,這叫做 幻覺(Hallucination)。就像一個學生考試時不確定答案,但還是很有自信地亂寫一個。
排排看!
排排看
把 AI 回答問題的步驟排成正確順序
- 組合成完整句子
- 預測下一個 Token
- 計算 Token 之間的關係
- 把問題切成 Token
隨堂測驗
1 / 3LLM 寫文章的方式最像什麼?