Kiến trúc ray tracing của Nvidia RTX 40 series được nâng cấp toàn diện, mạnh gấp 3 lần RTX 30 series

Kiến trúc ray tracing của Nvidia RTX 40 series được nâng cấp toàn diện, mạnh gấp 3 lần RTX 30 series

    RTX 40 ray tracing

    Phần cứng ray tracing thế hệ thứ 3 trên card Nvidia RTX 40 series không phải dạng vừa đâu các bạn ạ.

    Với thế hệ card đồ họa Ada Lovelace, Nvidia cho biết hiệu năng ray tracing của nó sẽ được cải tiến vượt bậc so với RTX 30 series. Ngoài việc có nhiều nhân ra, một yếu tố cũng quan trọng không kém đó là công nghệ mới mang tên Shader Execution Reordering (SER). Nó có chức năng sắp xếp các tác vụ theo thời gian thực, giúp tăng hiệu năng ray tracing của card RTX 40 series gấp 2-3 lần và tăng 25% hiệu năng gaming tổng thể so với thế hệ trước.

    RTX 40 ray tracing

    Nhân RT cũng được nâng cấp với thế hệ thứ 3, mang đến hiệu năng đạt 200 RT TFLOPS và băng thông “ray-triangle intersection” nhiều gấp đôi. Cơ bản thì nhân RT lần này có thêm 2 đơn vị phần cứng mới, bao gồm engine “opacity micromap” và engine “micromesh”. Tiếp đó là nhân Tensor thế hệ thứ 4 cũng được cải tiến, mang đến hiệu năng 1400 TFLOPS.

    RTX 40 ray tracing

    Ông Huang – CEO của Nvidia – giải thích rằng việc tăng hiệu năng ray tracing của Ada Lovelace là một điều cần thiết, do tính năng này nổi tiếng là rất khó để có thể xử lý song song. Cơ bản mà nói, ray tracing sẽ cần sử dụng rất nhiều thứ trên GPU tại nhiều thời điểm khác nhau, và đây cũng chính là lúc SER phát huy tác dụng. Nó sẽ giúp cải thiện hiệu suất ray tracing bằng cách sắp xếp các tác vụ shading theo thời gian thực nhằm khai thác tài nguyên GPU tốt hơn.

    RTX 40 ray tracing

    Những công nghệ này sẽ nằm trong card RTX 4090 ra mắt vào ngày 12/10 với giá là 1599 USD. Ngoài ra, chúng ta còn có RTX 4080 12GB và 16GB với giá lần lượt là 899 USD và 1199 USD, dự kiến ra mắt vào tháng 11.

    Tóm tắt ý chính:

    • Shader Execution Reordering trên card RTX 40 series giúp tăng hiệu năng ray tracing của RTX 40 series gấp 2-3 lần so với RTX 30 series
    • Nó hoạt động bằng cách sắp xếp các tác vụ shading theo thời gian thực nhằm khai thác tài nguyên GPU tốt hơn
    • Nhân RT cũng được nâng cấp với thế hệ thứ 3, được trang bị thêm engine “opacity micromap” và engine “micromesh”