A9VG电玩部落论坛

 找回密码
 注册
搜索
楼主: joeleon

PS5的GPU中究竟有没封装RDNA2的光追加速器?

[复制链接]

精华
0
帖子
798
威望
0 点
积分
870 点
种子
278 点
注册时间
2021-5-13
最后登录
2024-10-4
 楼主| 发表于 2021-6-16 23:20  ·  四川 | 显示全部楼层
airforce18 发表于 2021-6-16 22:49
19年底出样机并不能代表PS5就用不上RDNA2,RDNA2的样品差不多也是那个时候出,我认为光追单元是一样的,但 ...

嗯所以SONY的光追更多依赖于软件来实现,具有更强的扩展性

精华
0
帖子
798
威望
0 点
积分
870 点
种子
278 点
注册时间
2021-5-13
最后登录
2024-10-4
 楼主| 发表于 2021-6-16 23:24  ·  四川 | 显示全部楼层
午夜幽骑王 发表于 2021-6-16 22:49
首先,你说“PS5工程样机应该在19年底或20年初就做好了”,但AMD的RDNA2也不是2020年底才开始设计的,通常 ...


啊哈哈哈,所以专业人士还是愿意回答问题的,但得先挑下对方的刺,大哥你咋那么像我老师呢?
第一个问题我信你,毕竟你是业内人士不是吗
第二,看了下路径追踪和光子映射的算法描述,前者是如你所说的蒙特卡洛法递归采样,但光子映射是先存图,再计算,需要更多存储,但理论效率更高
第三,比起理论,我更相信实际表现,https://www.bilibili.com/video/BV17K4y1A7Tf,这是RX6700XT在生化8中的实际光追表现,还只是1080p,开启前近250帧,开启后直线降至90左右;而PS5在4k棋盘开启和不开光追都有接近60帧的表现
第四,你搁着说半天,依然把球踢给了“除非从索尼蹦出来一个人”
第五,之前的问题,照片里圈一圈,不圈自个儿,圈下肚子里水最多的也成啊,没准同学还真有认识的

精华
1
帖子
1079
威望
1 点
积分
1106 点
种子
34 点
注册时间
2012-11-3
最后登录
2025-2-26
发表于 2021-6-16 23:29  ·  河北 | 显示全部楼层
airforce18 发表于 2021-6-16 23:06
我翻阅了一下资料,发现两者都不是真正意义上桌面PC的RDNA2,都存在定制,以下是知乎大神转载***的解答:
...

说真的,XSX和XSS的CU真是太太太不像RDNA2的了,微软自己在ISSCC上的演讲中说,为实现12T浮点性能,测试了[email protected][email protected]两个方案,测试结果是[email protected]的功耗比[email protected]高20%,但鉴于保证芯片中56CU全部可用的良率成本,微软最终屏蔽4个CU,承受着额外20%功耗的代价选择了[email protected]

原文:
Paul Paternoster explained that from chips coming off the production line, a substantial number could run with all 28 WGPs enabled. The goal of the graphics was to provide 12 TFLOPs of performance, and so by some simple math, Microsoft could do either of the following to hit that number:
28 WGPs enabled at 1675 MHz
26 WGPs enabled at 1825 MHz
Both of these configurations enable 12 TFLOPs. Because the frequency of the 28 WGP design is lower, this also enables a lower voltage, combined for an overall power saving of 20% if all 28 WGPs are used.
Of course, a 20% power saving is quite substantial, as it would either enable better performance per watt, or enable higher performance. But the issue is that not enough processors were coming off of the production line with all 28 WGP running at this frequency. The variability of the processors, due to both transistor performance and defects, meant that 28 WGP versions didn’t make sense financially.



[email protected][email protected],CU少了4个(少了7.7%),频率提升150MHz(提升了9%),功耗就涨了20%?要知道RDNA2的一大重点改进就是CU的高频能力,可以在很高的频率下功耗仍不失控,XSX这个GPU的频率功耗曲线真的是RDNA2?

另外按微软自己在ISSCC上说的,XSX最高功耗270瓦,6700XT是整卡230瓦,降点频率把浮点控到12T的话功耗也就210瓦,再去掉infinity cache,连200瓦都不见得有,再捆上8颗Zen2 CPU核心,把显存位宽扩到320bit,加4颗GDDR6显存,功耗会比270瓦更高吗?既然微软顾及到良率问题宁可付出20%功耗代价也选择了52CU,那navi22这40CU的高良率小核心为什么不选呢?6700XT飙到2.58GHz也没见有什么功耗代价啊?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
该用户已被禁言

精华
0
帖子
6793
威望
0 点
积分
6937 点
种子
594 点
注册时间
2012-5-29
最后登录
2025-2-27
发表于 2021-6-16 23:34  ·  广西 | 显示全部楼层
本帖最后由 powerh3 于 2021-6-16 23:39 编辑

硬件光追同样需要软件上简化优化的,有多个简化算法的方案,蒙特卡洛算法就是简化。。

David王早就说过,目前光追是硬件、软件各占一半,很大程度上开发者对光追单元的调度是非常重要的。。


软件上来了,比如升分辨率技术和降噪技术的升级优化,就可以让光追的光影清晰度等效果上升一大截。。还有可以结合各种效率高、效果优 的软光照技术,不必直接光追硬上省了很多资源,大大提高整体效率。


还有制作中,对材质、反射次数、反射物体、反射距离判定算法等等,各种简化优化也可以让光追光照综合效果、效率大大提升。。
所以制作组的优化态度和能力也是至关重要的,不能缺失。

精华
0
帖子
798
威望
0 点
积分
870 点
种子
278 点
注册时间
2021-5-13
最后登录
2024-10-4
 楼主| 发表于 2021-6-16 23:38  ·  四川 | 显示全部楼层
powerh3 发表于 2021-6-16 23:34
硬件光追同样需要软件上简化优化的,有多个简化算法的方案,蒙特卡洛算法就是简化。。

David王早就说过, ...

嗯很中肯,光子映射除了理论效率更高,还有一点就是解决路径追踪会产生的噪点

精华
0
帖子
798
威望
0 点
积分
870 点
种子
278 点
注册时间
2021-5-13
最后登录
2024-10-4
 楼主| 发表于 2021-6-16 23:43  ·  四川 | 显示全部楼层
对手中的PS5又增添了一份信心,SONY的技术还是有保障的,得嘞各位,受教
该用户已被禁言

精华
0
帖子
4172
威望
0 点
积分
4241 点
种子
661 点
注册时间
2007-4-15
最后登录
2024-7-2
发表于 2021-6-16 23:46  ·  江苏 | 显示全部楼层
joeleon 发表于 2021-6-16 23:20
嗯所以SONY的光追更多依赖于软件来实现,具有更强的扩展性

无非与成本性能之间的平衡,我相信如果愿意多给钱,每个CU放两个光追也不是不可能
该用户已被禁言

精华
0
帖子
4172
威望
0 点
积分
4241 点
种子
661 点
注册时间
2007-4-15
最后登录
2024-7-2
发表于 2021-6-16 23:49  ·  江苏 | 显示全部楼层
午夜幽骑王 发表于 2021-6-16 23:29
说真的,XSX和XSS的CU真是太太太不像RDNA2的了,微软自己在ISSCC上的演讲中说,为实现12T浮点性能,测试 ...


我也觉得奇怪,就频率和功耗的对比,明显PS5更像RDNA2,XSX的频率功耗比更像RDNA1,而且多付出20%的功耗对供电散热都会有要求,成本也会提高,不见得比良率提升降低的成本有优势。
该用户已被禁言

精华
0
帖子
6793
威望
0 点
积分
6937 点
种子
594 点
注册时间
2012-5-29
最后登录
2025-2-27
发表于 2021-6-16 23:49  ·  广西 | 显示全部楼层
ASIC那么小,多些能贵很多?。。哈哈。。

精华
1
帖子
1079
威望
1 点
积分
1106 点
种子
34 点
注册时间
2012-11-3
最后登录
2025-2-26
发表于 2021-6-16 23:58  ·  河北 | 显示全部楼层
本帖最后由 午夜幽骑王 于 2021-6-17 00:02 编辑
joeleon 发表于 2021-6-16 23:24
啊哈哈哈,所以专业人士还是愿意回答问题的,但得先挑下对方的刺,大哥你咋那么像我老师呢?
第 ...


第一,从一开始你问问题的方向就没有意义,起码现阶段不会有准确答案。而且你选的这些素材真的是几乎每条都带错误……
第二,你说光子映射是先存图再计算,它存的图是第一步正向追踪使用shadow map生成的光子映射图,然后第二步再进行反向追踪,合成最后camera看到的游戏场景。简单点理解,本质上光子映射=0.x正向追踪+0.y反向追踪。正向追踪是完全符合真实物理原理的,缺点是效率低下,反向追踪是取巧的办法,也因此有一些从原理上无法实现的效果,光子映射这种正反混合可以解决单纯反向追踪的问题,但引入了效率很低的正向追踪之后,具体效率高低得看两部分的使用比例和使用方式,我不知道你说的理论效率更高是怎么得出的……
第三,这对比并没有建立在控制变量的基础上。A和N目前的光追设计,还处于路线之争的过程中,如果在光追算力相近的情况下,游戏跑的快点慢点,更多是看程序能不能合理有效的利用GPU的硬件设计,而不是看GPU硬件本身效率。目前各种游戏的PC版都还在这种挣扎或者说权衡中,像任何一方的倾斜都会影响在另一方上的性能表现,而大部分游戏的主机版落地时肯定就是对A完美适配的(不排除少部分比如啃臭)。另外你说生化8的PS5版表现好,XSX版不也一样么?这能说明PS5的RA特殊吗?
第四,同第一,不多说了。
第五,肚子里水最多的是第一排坐着的左数第三个,清华大学微电子学院院长魏少军
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2025-2-27 00:59 , Processed in 0.237977 second(s), 13 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部