feidan的头像-
管理员
这家伙很懒,什么都没有写...
MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理-

MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理

MIT韩松团队推出了高效的长上下文LLM推理框架DuoAttention,能够在单个GPU上实现330万Token的上下文推理。本文详细介绍了DuoAttention的技术特点、应用场景及其对大语言模型推理的创新贡献,探...
2年前
03377
AI大模型时代的四种玩家 | 大模型系列知识分享(1)-

AI大模型时代的四种玩家 | 大模型系列知识分享(1)

“AI大模型时代的四种玩家 | 大模型系列知识分享(1)”这个标题介绍了AI大模型领域的重要话题,并分享了相关的技术知识。 AI大模型是当前人工智能领域的重要趋势,对于许多公司和开发者来说,了...
2年前
03367
黄仁勋最新访谈:称华为是个好公司,分享对GPU、AI factory、RAG和人形机器人的看法-

黄仁勋最新访谈:称华为是个好公司,分享对GPU、AI factory、RAG和人形机器人的看法

“黄仁勋最近接受采访时表示,华为是一家优秀的公司。他分享了对GPU、AI工厂、RAG以及人形机器人的看法,这些话题在科技领域备受关注。黄仁勋作为NVIDIA的创始人,他的观点对于理解这些新兴技术...
2年前
033315
2024年第65届国际奥数大会:陶哲轩表示当前AI进展惊人,智能水平已与人类相当-

2024年第65届国际奥数大会:陶哲轩表示当前AI进展惊人,智能水平已与人类相当

在2024年第65届国际奥数大会上,陶哲轩再次表示当前AI技术的进展惊人,智能水平已经与人类相当,标志着人工智能领域的一个重要里程碑。
2年前
033315
阿里开源了一个基于Qwen2.0的agent框架:Qwen-Agent-

阿里开源了一个基于Qwen2.0的agent框架:Qwen-Agent

本文介绍了阿里巴巴最新开源的基于Qwen2.0的Agent框架——Qwen-Agent。该框架为企业提供了强大的AI能力,支持多种应用场景,展示了阿里在人工智能领域的持续创新和技术实力。
2年前
03336
4 步骤精通 LLM 微调:SiliconCloud 亲手教学,打造专属领域大模型-

4 步骤精通 LLM 微调:SiliconCloud 亲手教学,打造专属领域大模型

在本教程中,我们将手把手带你通过4个简单步骤,使用SiliconCloud平台微调LLM模型,助你快速打造适用于特定领域的强大模型,提升业务智能化水平。
1年前
03329