首页 > 3D标签高效 相关文章
DeepSeek发布NSA,革新长上下文训练与推理速度,打破性能瓶颈

DeepSeek发布NSA,革新长上下文训练与推理速度,打破性能瓶颈

2025年2月18日,人工智能领域又迎来了一项重磅技术突破。DeepSeek宣布推出其全新的技术——NSA(稀疏注意力机制),该技术专为超快速的长上下文训练和推理设计。NSA不仅与现代硬件高度兼容,并且能够在保持高性能的同时显著加速推理过程,同时降低了预训练成本。NSA的核心创新:高效的稀疏注意力机制随着AI模型对计算能力和内存需求的不断增长,长上下文任务的训练和推理一直是人工智能发展的瓶颈之一。...

10元快餐迅速占领北京市场,低价与效率成竞争关键

10元快餐迅速占领北京市场,低价与效率成竞争关键

在北京的社区中,一场不显山露水的“快餐大乱斗”正在上演。随着连锁中式快餐店的迅猛扩张,传统的正餐市场正遭遇前所未有的压力。这些新兴快餐店以低廉价格和快速高效的服务迅速吸引了大量顾客,尤其是外卖骑手等注重便捷和实惠的群体。例如,位于北京宋家庄地铁站附近的“红功夫”快餐店,凭借着自选现炒菜的模式,仅需10元就能享用一顿丰盛的午餐,这种价格和速度的优势使其在竞争激烈的市场中脱颖而出。在过去的一年里,红功...

灵境AI完成种子轮融资 数百万元助力AIGC内容生态扩张

灵境AI完成种子轮融资 数百万元助力AIGC内容生态扩张

2025年2月20日,专注于文创数字化和“AI+IP”内容生成的科技公司灵境AI宣布成功完成数百万元种子轮融资。本轮融资资金将主要用于AIGC技术的研发迭代、核心团队的扩建以及全球内容布局,助力灵境AI加速构建基于人工智能生成内容(AIGC)的内容生产与IP孵化生态系统。灵境AI凭借其领先的大数据和AI生成技术,致力于打造一个高效的IP生产链,目标是成为“AI时代的IP梦工厂”。通过深入探索小说、...

DeepSeek开启“开源周”发布Flash MLA代码库,优化Hopper GPU加速

DeepSeek开启“开源周”发布Flash MLA代码库,优化Hopper GPU加速

DeepSeek启动开源周,发布Flash MLA代码库助力GPU优化2025年2月24日,北京——DeepSeek今日宣布启动其“开源周”计划,正式发布首个开源代码库——Flash MLA。这是一个专为Hopper GPU优化的高效MLA(多级解码)解码内核,经过针对可变长度序列的优化,已成功投入生产,标志着DeepSeek在开源技术领域迈出了重要一步。Flash MLA代码库:专为Hopper...

DeepSeek开源DeepEP通信库:为MoE模型训练和推理提供高效解决方案

DeepSeek开源DeepEP通信库:为MoE模型训练和推理提供高效解决方案

2025年2月25日,DeepSeek在开源周第二日宣布,成功开源DeepEP,这是第一个专为Mixture of Experts(MoE)模型训练和推理设计的开源EP通信库。DeepEP旨在提升MoE模型的计算效率,提供高效的节点内和节点间通信,优化GPU资源管理,并为AI开发者提供更灵活、低延迟的解决方案。1. DeepEP通信库:MoE模型的高效支持DeepEP是专门为MoE(Mixture...

DeepSeek发布开源DeepGEMM,推动FP8矩阵运算高效化

DeepSeek发布开源DeepGEMM,推动FP8矩阵运算高效化

DeepSeek在开源周活动中再次迈出重要一步,今天上午发布了其全新开源项目——DeepGEMM。该项目专注于FP8高效通用矩阵乘法(GEMM)库的开发,并以其强大的功能和极高的算力优化能力迅速引起了国内外技术圈的热议,文章发布后不久便收获了超过2.1万的阅读量。DeepGEMM作为一款基于CUDA开发的库,专为高效矩阵计算需求而设计,特别适用于普通及混合专家(MoE)分组的矩阵运算。其轻量级即时...

跨境电商激战北美,物流破局之路在何方?

跨境电商激战北美,物流破局之路在何方?

随着中国跨境电商“出海”步伐的加快,北美市场已成为竞争激烈的主战场。跨境电商的背后,强大的物流体系为商家们的生死存亡提供了关键保障。在众多电商平台争夺市场份额的同时,如何打破北美庞大且复杂的物流瓶颈,成为了跨境电商能否成功的关键因素之一。北美电商竞争态势日益激烈北美市场,特别是美国,已成为中国跨境电商企业争相攻占的重要阵地。根据Mordor Intelligence的报告,2025年,美国的电子商...

DeepSeek R1赋能美图设计室,AI图文大幅提升内容生产效率

DeepSeek R1赋能美图设计室,AI图文大幅提升内容生产效率

美图公司旗下的美图设计室近日宣布,成功接入DeepSeek R1大模型,推出全新AI图文功能。这一创新功能为创作者提供了一站式的AI图文创作体验,极大提升了自媒体内容生产效率,帮助用户快速生成高质量的小红书图文内容。在传统的创作过程中,许多自媒体创作者常常面临效率低、专业门槛高和创意受限等问题。而美图设计室的AI图文功能,通过DeepSeek R1的强大支持,使得创作者只需输入简单的主题并选择De...

夸克AI搜索新突破,“深度思考”引领搜索新时代

夸克AI搜索新突破,“深度思考”引领搜索新时代

随着人工智能技术的飞速发展,夸克迎来了一次重大升级。近日,夸克宣布完成了夸克App和PC端的全面改版,并首次推出了AI搜索功能“深度思考”。这一新功能将大模型的深度思考能力融入搜索服务,极大提升了搜索的精准度与智能化水平,进一步推动了搜索行业的变革。根据夸克方面的介绍,夸克AI搜索“深度思考”能精准理解用户的真实需求和深层意图,特别是对于个性化和复杂问题的高效解答。用户只需输入主题,系统便能够深度...

技术分析:摩尔线程如何支持 DeepSeek “全家桶”

技术分析:摩尔线程如何支持 DeepSeek “全家桶”

全新架构与关键技术加持。 摩尔线程此次适配的核心在于其升级后的 MUSA Compute Capability 3.1 GPU 架构及配套软件栈。该架构首次提供了 原生 FP8(8位浮点)计算能力,并搭载自研的高性能线性代数模板库 MUTLASS。借助这些技术突破,摩尔线程得以及时优化实现 DeepSeek 开源项目中的关键算法。例如,在 FlashMLA(高效多头潜在注意力推理内核)中,摩尔线程...

智能浪潮催生变革新机遇 打工人迎来转型升级挑战

智能浪潮催生变革新机遇 打工人迎来转型升级挑战

近年来,随着DeepSeek等先进人工智能技术在政务服务中的深入应用,深圳、江西、无锡、乌鲁木齐等多个城市纷纷率先部署“数智员工”。以深圳福田区为例,该区基于DeepSeek打造的70名AI“数智员工”已经在公文处理、民生服务、应急管理和招商引资等多个场景中发挥重要作用。据统计,公文格式修正准确率已突破95%,审核时间缩短90%,跨部门任务派遣效率大幅提升。政务大模型的应用,使得政府部门在处理海量...

游戏出海广告聚合平台怎么做?打造高效变现的全球化解决方案

游戏出海广告聚合平台怎么做?打造高效变现的全球化解决方案

随着全球游戏市场的蓬勃发展,越来越多的游戏开发者将目光投向海外市场。然而,面对多元化的广告渠道、复杂的变现模式和激烈的竞争环境,如何高效管理和优化广告资源成为游戏出海成功的关键。广告聚合平台应运而生,成为游戏开发者实现全球化变现的得力助手。本文将深入探讨游戏出海广告聚合平台的构建策略,帮助开发者在全球市场中脱颖而出。一、什么是游戏出海广告聚合平台?广告聚合平台是一种技术解决方案,旨在整合多个广告渠...

豆包AI“深度思考”模式震撼上线:字节跳动全自研算法引领推理新纪元

豆包AI“深度思考”模式震撼上线:字节跳动全自研算法引领推理新纪元

2025年3月6日,北京——字节跳动旗下的AI大模型“豆包AI”今日正式推出全新“深度思考”推理模式。该模式覆盖问答、搜索、写作与阅读等多场景,用户只需在输入框内开启“深度思考”开关即可体验这一突破性功能。通过纯自研的强化学习算法,该功能实现了算力效率与模型性能的完美平衡,标志着字节跳动在AI推理领域迈出了关键一步。【核心内容】据凤凰网科技报道,豆包AI此次推出的“深度思考”模式基于其1.5 Pr...

开源狂潮来袭:OpenManus深夜出击打破邀请码垄断,Manus生态迎来变局

开源狂潮来袭:OpenManus深夜出击打破邀请码垄断,Manus生态迎来变局

2025年3月7日,北京——就在Manus全网邀请码炒至天价、用户难以触及之际,一场开源界的“核爆”行动震撼上线。由MetaGPT核心贡献者推动的OpenManus项目,仅用三小时代码量便全盘复刻Manus核心功能,无需邀请码即可体验,其快速落地与高效协作模式对Manus封闭生态构成了有力打脸。同时,Manus X官方账号遭遇冻结,使得这场技术较量更显戏剧性,暗示着AI智能体生态即将迎来一轮全新洗...

AI 2.0 时代:鸿蒙原生应用开发者手握入场券

AI 2.0 时代:鸿蒙原生应用开发者手握入场券

当生成式 AI 技术席卷全球、颠覆传统产业之时,我们正迎来一场类似电力催生工业革命般的科技浪潮。以 DeepSeek 为代表的生成式大模型,以短短数周内爆发出惊人用户规模,昭示着全民智能时代的真正来临。面对这一“现象级”的突破,企业与开发者必须重新审视底层技术架构,才能在变革浪潮中赢得先机。智能化时代的底层重构在过去,许多企业为了解决多语种、本地化等问题,不得不耗费大量资源进行技术调试与内容转化。...

字节对MoE模型训练成本再砍一刀 成本可节省40%

字节对MoE模型训练成本再砍一刀 成本可节省40%

字节豆包大模型团队今日正式开源一项针对MoE(混合专家模型)架构的关键优化技术。据悉,该技术在实际应用中已实现大模型训练效率提升1.7倍,同时可显著降低训练成本达40%,为人工智能领域的大规模模型训练带来了全新突破。技术创新 助力大模型训练此次开源的优化技术针对MoE架构中存在的计算资源分配和调度瓶颈问题,采用了全新的算法优化方案和调度策略。经过在字节旗下万卡集群的实战检验,该技术累计帮助节省了数...