Meta震撼发布:4050亿参数Llama3.1-405B大模型开源,多项评测超越GPT-4o与Claude3.5 Sonnet
Meta公司震撼发布4050亿参数的Llama3.1-405B大模型,并开源共享,多项评测结果显示其性能超越GPT-4o与Claude3.5 Sonnet。
463亿!OpenAI官宣新融资,估值突破11000亿,AI超级巨无霸诞生
OpenAI宣布完成463亿新融资,估值突破11000亿,标志着AI领域的超级巨无霸正式诞生,展示了其在技术发展和市场地位上的重大突破。
乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need
MIT和清华校友提出了一种全新的优化方法,将Transformer中的乘法操作变为加法操作,显著提升了模型性能。本文将详细介绍这一创新方法及其在深度学习领域的应用前景。