论文里程碑 #8:Natural Language Processing (Almost) from Scratch2026-06-27·4362 字·9 分钟LLM LLM 论文里程碑 NLP 词向量 预训练 SENNA Collobert 特征工程
经典作品拆解 #8:White Fence(白色栅栏)2026-06-27·4744 字·10 分钟摄影 摄影 经典作品 摄影史 Paul Strand White Fence 直接摄影 形式抽象 图地关系
13 Embedding 查表:离散 ID 到连续语义的惊险一跃2026-06-23·5083 字·11 分钟LLM LLM Embedding 词嵌入 查找表 One-Hot 分布式表示 向量空间 Hidden State
论文里程碑 #7:A Neural Probabilistic Language Model2026-06-17·4227 字·9 分钟LLM LLM 论文里程碑 词嵌入 Word Embedding 神经语言模型 Bengio 维度灾难 NLP
论文里程碑 #6:Latent Dirichlet Allocation2026-06-14·4336 字·9 分钟LLM LLM 论文里程碑 主题模型 LDA Topic Model 贝叶斯生成模型 无监督学习 NLP
经典作品拆解 #6:People of the 20th Century(20 世纪的人)2026-06-14·4273 字·9 分钟摄影 摄影 经典作品 摄影史 August Sander 类型学 Typology 肖像 纪实摄影
12 词表大小与 Token 危机:算术差、单词反转失败的结构性原因2026-06-14·4924 字·10 分钟LLM LLM Tokenizer 词表大小 Vocab Size Token 危机 Glitch Token 分词 算术