RTX 40 系显卡 GTC「炸场」发布,性能提升 70%,价格再创新高

中关村在线

雷峰网消息,9 月 20 日的 GTC 活动上,英伟达 CEO 黄仁勋在演讲中发布了万众瞩目的英伟达新一代游戏显卡 RTX40 系列。

本次英伟达共发布了三款显卡,分别是 RTX 40 系旗舰显卡 RTX 4090 与定位高端的 RTX 4080 16GB、RTX 4080 12GB。

RTX 40 系列显卡采用了新一代 RTX 架构,计算能力再次实现跨越式发展。而光追技术的全新升级与 DLSS3 的加入,也为游戏玩家带来了全新的升级体验。

RTX 4090 显卡将在 10 月 12 日上市,而 RTX 4080 显卡则将在 11 月上市。

加量也加价,40 系显卡性能、价格双「越级」

RTX4090 采用了全新的第三代 RTX 架构,并使用台积电 4N 工艺制造。

新一代 RTX 以世界上第一位计算机程序员 Ada Lovelace 的名字命名,黄仁勋在演讲中表示,得益于英伟达与台积电的紧密合作,专为 GPU 制造优化的 4N 工艺让 Ada Lovelace 架构能够集成 760 亿个晶体管和超过 18000 个 CUDA 核心,较上一代 Ampere 架构多 70%,能耗比相较 Ampere 则提升一倍。

图 新一代 Ada 架构

采用了 Ada 架构的 40 系显卡在性能表现上远远超过前辈 30 系显卡。

旗舰定位的 RTX 4090 集成了 760 亿个晶体管、16384 个 CUDA 核心,并拥有 24GB 显存。

英伟达表示,在强大硬件指标的加持下,RTX 4090 显卡即使在 4K 分辨率下,依然可以获得超过 100FPS 的流畅游戏体验。

能效方面,RTX 4090 功率为 450W,与 RTX 3090Ti 保持一致,但英伟达称在同样功率下,4090 的游戏表现较 RTX 3090Ti 提升一倍。

定位低一档的 RTX 4080 则有 16GB 与 12GB 两个显存版本,16GB 版本集成了 9728 个 DUDA 核心。英伟达称 RTX 4080 16GB 的游戏性能两倍于 RTX 3080,并超过了上一代旗舰 RTX 3090 Ti。

而 12GB 版本的 RTX 4080 则集成了 7680 个 CUDA 核心,理论性能也超越了上一代旗舰 RTX 3090 Ti。

全新架构还搭载了 Opacity Micromap 引擎,将光线追踪的 Alpha-Test 集合性能提升 2 倍。全新的 Micro-Mesh 引擎则能够在不带来更多的 BVH 构建和存储资源消耗的前提下提升图形的丰富度。

最后,全新 Tensor Core 新增了 Hooper FP8 Transformer Engine 可以提供 1.4 petaFLOPS 张量处理性能。在性能获得巨大升级的同时,这一代英伟达游戏显卡的价格也再创新高。

RTX 4090 建议零售价为 12999 人民币起,相比上一代 RTX 3090 11999 元的其售价涨价 1000 元。

图 RTX 40 系列显卡售价

而 RTX 4080 价格则上探到了 9499 元,相较上一代 RTX 3080 5499 元的起售价可谓完成 " 消费升级 "。即使结合英伟达本代显卡将没有 RTX 4080Ti 的传闻,RTX 4080 16GB 的其售价也比上一代同定位的 RTX 3080 Ti 的 9499 元略有提价。

更低配置的 RTX 4080 12GB 的其售价也高达 7199 元,与上一代同定位的 RTX 3070Ti 的 4499 元售价也涨势凶猛。

光追再升级,游戏中 AI" 偷天换日 "

本次 RTX 40 系列显卡最重要的升级之一就是对光线追踪技术的升级。

RTX 系列显卡最初问世就以光线追踪为特色功能,本次 40 系的更新更是 " 牙膏挤爆 ",正如英伟达 CEO 黄仁勋所说:" 英伟达重新定义了图形。"

新的 Ada Lovelace 架构具有高达 90TFLOPs 的着色器能力,吞吐量超过上一代产品两倍。除此之外,Ada 架构的 SM 多单元流处理器还使用了着色器重排序技术(SER),可实现对任务的实时重新调度。黄仁勋强调这项技术对 GPU 来说是革命性的,原理上与 CPU 的乱序执行技术类似。

对于这项技术,黄仁勋在演讲中解释道,光线追踪的工作负载需要不同的线程处理,不同着色器之间很难合并工作,SER 技术则能够即时安排着色器负载,从而提高执行效率,更好地利用 GPU 资源,打造更好的光线追踪效果。

图 SER 技术工作原理

这项技术能够让英伟达显卡光线追踪性能提升 2-3 倍,整体游戏性能提升 25%。

在提升计算能力之外,英伟达还通过多种方式提升终端游戏体验。在演讲中,黄仁勋表示,和加速计算一样,计算机图形的也是一项全栈挑战。要实现突破还需要在架构、设计和算法上创新。

此前在 RTX 显卡上始终扮演着重要角色的 DLSS 技术本次也迎来了重大更新。

在 RTX 显卡上,DLSS 技术一直是光线追踪技术的重要 " 搭档 ":光线追踪模拟出更真实、更贴近现实效果的游戏场景,DLSS 技术则利用 AI 算法降低模拟这样的真实物理环境所需要的计算量,保证用户流畅的游戏体验。

这次,第三代 DLSS 技术同 RTX 40 系显卡一同登场,并带来了开创性的光学多帧生成功能。

与之前最大的不同在于,第三代 DLSS 技术生成的不再是像素,而是全面的画面帧。

基于 Ada Lovelace 架构的新光流加速器,第三代 DLSS 技术可以分析两帧连续的游戏图像,并向神经网络输入像素级的从帧到帧的运动方向和速度信息,此后神经网络模型将据此计算出中间帧。

这样的中间帧由神经网络计算生成,不再涉及图形渲染,完全独立于游戏。这能够大大减轻游戏中即时演算的运算量。

通俗的讲,游戏中的画面是由 GPU 这个 " 画家 " 通过算力的 " 画笔 " 创造的,DLSS3 技术能在两张画作之间插入了一张 AI 生成的 " 照片 ",从而彻底解放 GPU" 画家 " 的双手。

英伟达表示第三代 DLSS 技术相较于单纯渲染的方式可以将游戏性能提高 4 倍。

黄仁勋表示,DLSS 3 能够为 Ada GPU 带来远高于 CPU 可计算的帧率,从而让一些对 CPU 要求较高的游戏也从中受益。

在现场,英伟达展示了两款对 CPU 要求较高的游戏,在开启 DLSS3 后,《赛博朋克 2077》与《微软模拟飞行》的帧率增加都超过一倍,达到 90 帧以上。

图 开启 DLSS3 前后,《微软模拟飞行》帧率变化

《传送门》连接过往与将来,英伟达冲向元宇宙

游戏,是 RTX 40 系列发布时一个重要话题。

在发布 40 系显卡的同时,本次英伟达还颇有复古精神的带来了经典游戏《传送门》重制版。

这款被称为《传送门 RTX》的游戏,实际上是英伟达基于其元宇宙创作平台 onmiverse 创建的一个 mod。

图 使用光追技术的《传送门》重制版

英伟达巧妙地用《传送门》,连接起了过去和未来。

正如这一经典游戏的玩法:开启传送门,走向另一端。

在英伟达看来,传送门的另一端无疑是属于元宇宙的世界。

黄仁勋表示,mod 是一种受众庞大的游戏文化,各种游戏 mod 每年下载量已经突破数十亿次。在 10 款最热门的竞技游戏中,有 9 款都能见到 mod 的身影。

英伟达为游戏 mod 设计者打造了一款名为 RTX Remix 的 Ominverse 应用。

基于该工具,游戏开发者可以为各种经典游戏制作 mod 添加 RTX 光追效果。

基于该工具,mod 制作者需要将游戏导入 USD 中,然后使用 modding 工具来创建光线追踪 mod,并导出至 RTX 渲染器。该工具还使用 AI 技术,以提升 mod 材质的质感。

英伟达在几年前就已经创建了名为 Onmiverse 的元宇宙创意平台,让元宇宙开发者可以通过这个 3D 平台互相连接并共同协作。

无论是 RTX 40 系列显卡更强的 GPU 算力,还是更真实的光追效果,都无疑将会为元宇宙的生态贡献更强的力量。

在老黄演讲的开头,是一段 RacerX 演示的 demo。RacerX 是基于 Omniverse 构建的全交互式仿真演示,其中所有的基于现实物理规律,所有光照、反射和折射则采用光线追踪技术。

这也许昭示着英伟达眼中的未来:在更加强大的显卡性能与 AI 能力加持下的更加真实的游戏体验和元宇宙场景。

免责声明:本文来自王科嘉,不代表浮光掠影知识网 - 专注有价值知识的生活内容平台的观点和立场,如有侵权请联系本平台处理。

相关阅读

    发表评论

    表情:
    评论列表(暂无评论,1277人围观)

    还没有评论,来说两句吧...

    取消
    微信二维码
    微信二维码
    支付宝二维码