架构_3D标签 - 大屏时代

月之暗面Kimi联合清华大学等开源共建大模型推理架构Mooncake

月之暗面科技有限公司与清华大学MADSys实验室联合发布了一项名为Mooncake的开源项目，旨在共建以KVCache为中心的大模型推理架构。2024年6月，双方曾联合发布Kimi底层的Mooncake推理系统设计方案，该方案基于PD分离和以存换算架构，显著提升了推理吞吐量，受到业界广泛关注。Mooncake项目从论文延伸而来，以超大规模KVCache缓存池为中心，通过以存换算的创新理念减少算力开...

Liquid AI 推出液态神经网络架构，性能超越传统 Transformer

麻省理工学院（MIT）计算机科学与人工智能实验室（CSAIL）孵化的创新公司 Liquid AI，宣布推出新一代液态神经网络（Liquid Neural Networks, LNN）架构。这一技术创新在多模态数据处理领域表现卓越，其效率和灵活性超越了当前广泛使用的 Transformer 模型。突破性技术：液态神经网络架构液态神经网络从神经科学、物理学和动力系统中汲取灵感，采用动态系统设计，能够高...

亚马逊推出第三代AI训练芯片 Trainum3，推动AI计算性能革命

大屏时代 (DapingTime.com) 12月5日消息 — 亚马逊近日宣布推出其第三代AI训练芯片——Trainum3。作为全球领先的电商巨头，亚马逊在人工智能和云计算领域的不断创新，再一次通过这一全新的硬件产品，进一步巩固了其在AI技术上的领导地位。Trainum3芯片是继第一代和第二代Trainum芯片之后的全新升级，专为AI模型的训练任务优化设计，旨在为大规模机器学习任务提供更高的计算...

数据与存储：AI时代的核心支撑与变革

在人工智能（AI）和生成式AI（AIGC）技术日益普及的今天，数据的价值愈加凸显，成为推动数字化转型和企业创新的核心资产。根据Gartner的预测，到2028年，企业软件应用程序中将有33%的应用具备自主性AI，企业对数据的依赖和利用将达到空前水平。在这一过程中，存储作为承载数据的关键基础设施，正在经历前所未有的变革。数据的力量：AI与数据的双向推动人工智能的发展，离不开三个关键要素：算力、算法和...

DisPose：革新动画制作的AI技术，人物动作实时复制

在人工智能与计算机视觉技术日新月异的今天，数字内容创作领域迎来了新的突破。近日，一项名为“DisPose”的创新技术吸引了业界的广泛关注。该技术通过输入动作视频和参考人物图像，即可实现让参考人物执行视频中的动作，为动画制作提供了前所未有的控制性和表现力。传统动画生成的局限传统的动画制作和人物动作捕捉方法多依赖于稀疏的骨骼姿态信息或有限的运动数据。这些方法在生成动态视频时常常面临精准度不足和动作表现...

Meta首席AI科学家LeCun访谈：为什么他一直认为AI还不如一只猫？

Meta首席AI科学家、图灵奖得主Yann LeCun再次引起了人工智能领域的广泛关注。在与AI深度研究员的深度访谈中，LeCun坚定地表达了一个令人惊讶但又深刻的观点：现今最先进的AI系统，尽管能够在许多领域展现出令人瞩目的能力，但在理解和互动于真实世界方面，依然远远不如一只猫。这一观点不仅揭示了当前AI技术的局限性，也为我们指明了AI发展的未来方向。一、从猫的智慧谈起LeCun并没有从技术层面...

微软论文再曝OpenAI模型参数，医疗AI评测意外暴露4o-mini只有8B参数

在一篇聚焦医疗AI评测的研究论文中，微软似乎再次“意外”披露了多个顶级大语言模型的参数规模。这篇论文发布于12月26日，不仅揭示了包括OpenAI、Anthropic等公司的模型参数信息，还引发了业内对大模型架构和技术实力的广泛讨论。主要内容亮点OpenAI的模型参数论文中提到，OpenAI的o1-preview模型约有300B参数，而GPT-4o模型的参数约为200B，令人震惊的是，GPT-4o...

清北应届生撑起DeepSeek天：年轻团队背后的中国版OpenAI

DeepSeek-v3横空出世，震撼AI圈以 1/11算力超越 Llama3 的开源大模型 DeepSeek-v3 引爆了AI领域的关注。而随着这一技术突破的公开，团队的年轻化背景成为外界热议的焦点——一个由清华、北大的应届毕业生撑起的团队如何走向行业前沿？DeepSeek团队：年轻化与高创新的结合DeepSeek团队最大的亮点在于年轻化。核心技术岗位大多由博士在读生或应届毕业生担任，这些来自...

突破传统语言模型的边界：Meta AI的“大概念模型”革新解读

近年来，随着自然语言处理（NLP）领域的不断发展，生成式语言模型（如GPT系列）已在许多任务中表现出强大的能力。然而，尽管大型语言模型（LLMs）在处理文本生成、问答和摘要等任务中取得了显著进展，它们仍然依赖“逐字预测”（token-level processing）的方法。这种方法虽然有效，但却存在局限，无法实现真正意义上的“深度理解”和“灵活生成”。Meta AI的全新大概念模型（LCMs）以...

AMD旗舰显卡发布在即：抢攻英伟达中端市场

随着AMD的RDNA 4架构显卡即将亮相，显卡市场的竞争格局再度发生剧烈变化。据业内爆料，本月底，AMD将推出其新一代旗舰显卡——Radeon RX 9070和RX 9070 XT。这款显卡被称为AMD在抢占英伟达中端市场的关键一招，预计将与英伟达的RTX 4080 Super展开正面竞争，成为游戏玩家和内容创作者的新宠。RDNA 4架构：AMD的新一代显卡技术根据来自科技论坛Chiphell的爆...

Imagination聚焦图形与AI：终止RISC-V CPU开发，重新定义业务重心

英国半导体IP企业Imagination Technologies宣布停止其RISC-V CPU产品线开发，全面转向图形、人工智能（AI）与边缘计算等核心领域。此举标志着该公司在半导体生态系统中战略重心的重大调整，旨在通过优化资源配置，应对行业变革与机遇。Imagination的声明：资源集中，发力关键领域Imagination在声明中表示：“我们已退出独立的CPU产品线开发，将资源集中于对业务...

高通卷土重来，再战服务器芯片市场！前Intel Xeon首席架构师加盟助阵

2025年1月15日，高通公司正式宣布重返服务器芯片市场，并且这一回，它准备带着强大的技术积累和一位重量级人物的加盟再次出击。据悉，Intel前Xeon处理器首席架构师Sailesh Kottapalli已经加入高通，担任高级副总裁一职。这一变动无疑是高通在服务器领域重整旗鼓的重大信号。1. Sailesh Kottapalli的加入：高通的强力引援Sailesh Kottapalli在英特尔工作...

eepseek退位，Minimax开源的新王！革新NLP领域的线性注意力模型

2025年1月15日，Minimax-Text-01 和 Minimax-VL-01 在Hugging Face平台开源，这标志着NLP领域的又一次重要突破。凭借线性注意力架构和出色的处理能力，Minimax模型在长文本处理和推理速度上展现了前所未有的优势，迅速成为业内的焦点。本文将深入分析这两款模型的优势，以及它们如何革新自然语言处理（NLP）领域。1. Minimax模型的诞生：应对长文本的挑...

MiniMax-01：引领下一代大模型技术，开启“Transformer时刻”

在大模型领域，几乎每一次创新都意味着技术的飞跃。从Transformer的崛起到GPT系列的壮大，每一次进展都让人工智能朝着更强大的方向前进。而今天，MiniMax公司推出的MiniMax-01，再次让人看到了大模型架构和技术突破的巨大潜力。它不仅代表着国内在大模型领域的技术前沿，也标志着一个新的“大模型时代”的开始。400万Token上下文：大模型的突破1月15日，MiniMax正式发布了预告已...

DeepSeek-V3：开源创新赋能中国AI，推动全球AI生态走向开放与高效

近年来，人工智能技术的飞速发展掀起了一场全球性的技术竞赛。面对复杂的国际环境和日益加剧的技术封锁，中国科技企业不断突破瓶颈、创新求变，逐步缩小与世界领先水平的差距。2025年，中国初创公司DeepSeek推出的全新开源大语言模型DeepSeek-V3以卓越的性能和超高的性价比，在国际市场上掀起波澜，成为AI领域的焦点。性能对标顶级模型，中文处理独树一帜DeepSeek-V3在文本理解、数学推理和代...

阶跃星辰发布Step-2mini与Step-2文学大师版，AI创作迈入新纪元

2025年1月20日，上海阶跃星辰智能科技有限公司重磅发布了Step系列语言模型的全新成员——Step-2mini和Step-2文学大师版。这两款新模型的推出，标志着阶跃星辰在满足市场需求和优化用户体验方面迈出了坚实一步，为各类创作场景提供了更具差异化的解决方案。Step-2mini：轻量高效，极致响应作为Step-2的轻量化版本，Step-2mini凭借其仅占Step-2约3%的参数量，却依然保...

首页 1 2 3 尾页