hello-agents笔记
大语言模型基础1. 从 N-gram 到 RNN 统计语言模型一个句子出现的概率,等于该句子中每个词出现的条件概率的连乘:\[\begin{aligned}P(S) &= P(w_1,w_2,\ldots,w_m) \\&= P(w_1)\cdot P(w_2\mid w_1)\cdot P(w_3\mid w_1,w_2)\cdots P(w_m\mid w_1,\ldots,w_{m-1})\end{aligned}\] N-gram(数据稀疏性;泛化能力差)Tri...…