MIT系初创打破Transformer霸权:液体基础模型刷新SOTA
MIT系初创公司推出的液体基础模型首次显著超越Transformer,刷新了SOTA记录,展示了非GPT架构在人工智能领域的最新技术突破。
清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,LlamaQwenMiniCPM都能上分
清华大学和厦门大学等机构提出了“无限长上下文”技术,显著提升了大模型在长文本处理中的性能。本文详细介绍了这一技术的特点、应用场景及其对Llama、Qwen、MiniCPM等模型的优化效果,探讨了这...