讨论语言系统(如英语、法语)的设计比较与多模态人工智能模型的架构演进及训练原理。
視頻模型與對話模型的演變;視覺vs文本的向量對齊;多模態大模型的分辨率無關性;視頻 Token 的時空壓縮 vs 糖葫蘆串
英語的「縫合怪」本質;法語 vs 英語:貴族花園 vs 野生叢林;法語金融詞彙的「法律條文」 vs 英語的「古老隱喻」