RTX 4090 “Ada Lovelace” - 16384 Cores, 24 GB GDDR6X, nhanh hơn 4 lần so với RTX 3090

RTX 4090 “Ada Lovelace” - 16384 Cores, 24 GB GDDR6X, nhanh hơn 4 lần so với RTX 3090

    Những chiếc card đồ hoạ cao cấp nhất trong thế hệ card đồ hoạ mới RTX 4000 series đó là RTX 4090, RTX 4080 đã được NVIDIA công bố chính thức vào trưa ngày hôm nay, hãy cùng xem là RTX 4090 có những cải tiến, nâng cấp gì nổi bật qua bài viết này. 

    NVIDIA GeForce RTX 4090 ở đây là BFGPU thế hệ tiếp theo, cung cấp hiệu suất cực khủng và đưa trải nghiệm chơi game lên tốt hơn rất nhiều. GeForce RTX 4090 không chỉ là một GPU, mà nó còn là sản phẩm hàng đầu của NVIDIA và cung cấp hiệu suất tăng gấp bốn lần so với người tiền nhiệm của nó. 

    NVIDIA nâng tầm trải nghiệm chơi game lên một tầm cao mới với GeForce RTX 4090 BFGPU thế hệ tiếp theo của nó, được tích hợp GPU nhanh nhất.  

    GeForce RTX 4090 của NVIDIA đã được người dùng công nghệ trên toàn thế giới chờ đợi từ lâu và bây giờ nó cuối cùng cũng đã xuất hiện. Card đồ họa được thiết kế cho những người đam mê chơi game và những game thủ muốn có độ trung thực hình ảnh tốt nhất và để đạt được điều đó, bạn muốn có một GPU mạnh mẽ hơn khi biết được rằng mức độ yêu cầu về mặt hiệu năng của card đồ hoạ từ các tựa game AAA thế hệ tiếp theo sẽ là rất cao. NVIDIA không thúc đẩy chip tiếp theo của mình nhanh hơn vài phần trăm hoặc 50% so với thế hệ trước mà nhanh hơn gấp 4 lần với DLSS và nhanh hơn gấp 2 lần ở độ phân giải gốc để đảm bảo rằng các card đồ họa của họ không chỉ sẵn sàng cho các titles sắp tới mà còn cho các tính năng nâng cao như Ray Tracing, v.v.

    GPU AD102 'Ada Lovelace' của NVIDIA - Sức mạnh thế hệ tiếp theo 

    Điểm nhấn nổi bật của card đồ họa NVIDIA GeForce RTX 4090 là GPU Ada Lovelace AD102. GPU có kích thước 608,4mm2 và sẽ sử dụng nút xử lý TSMC 4N, đây là phiên bản được tối ưu hóa của nút 5nm (N5) của TSMC được thiết kế cho NVIDIA. GPU có 76,3 tỷ bóng bán dẫn. 

    GPU NVIDIA Ada Lovelace AD103 dự kiến ​​sẽ có tối đa 7 GPC (Cụm xử lý đồ họa). Đây là số lượng GPC giống như GPU Ampere GA102 và một GPC bổ sung so với GPU GA103. Mỗi GPU sẽ bao gồm 6 TPC và 2 SM có cùng cấu hình với chip hiện có. Mỗi SM (Bộ xử lý đa luồng) sẽ chứa bốn lõi phụ, cũng giống như GPU GA102. Điều thay đổi là cấu hình lõi FP32 và INT32. Mỗi lõi con sẽ bao gồm 128 đơn vị FP32 nhưng các đơn vị FP32 + INT32 kết hợp sẽ tăng lên đến 192. Điều này là do các đơn vị FP32 không chia sẻ cùng một lõi phụ như các đơn vị IN32. 128 lõi FP32 tách biệt với 64 lõi INT32. 

    Tổng cộng mỗi lõi phụ sẽ bao gồm 32 FP32 cộng với 16 đơn vị INT32 cho tổng số 48 đơn vị. Mỗi SM sẽ có tổng cộng 128 đơn vị FP32 cộng với 64 đơn vị INT32 cho tổng số 192 đơn vị. Và vì có tổng cộng 84 đơn vị SM (12 đơn vị trên mỗi GPC), 12.288 đơn vị FP32 và 6.144 đơn vị INT32 cho tổng số 18.432 lõi là những con số đang được giới công nghệ dự đoán về số FP32 và INT32 cho 18.432 lõi. Mỗi SM cũng sẽ bao gồm hai Wrap Schedules (32 luồng / CLK) cho 64 wraps per SM. Đây là mức tăng 50% đối với các lõi (FP32 + INT32) và tăng 33% về Wraps / Threads so với GPU GA102. 

    NVIDIA AD102 'Ada Lovelace' Gaming GPU 'SM' Block Diagram (Image Credits: Kopite7kimi):

     

    Chuyển sang bộ nhớ đệm cache), đây là một phân khúc khác mà NVIDIA đã tăng cường mạnh mẽ so với các GPU Ampere hiện có. GPU Ada Lovelace will pack 192 KB bộ nhớ đệm L1 cho mỗi SM, tăng 50% so với Ampe. Đó là tổng cộng 4,5 MB bộ nhớ đệm L1 trên GPU AD102 flagship. Bộ nhớ đệm L2 sẽ được tăng lên 96MB như đã đề cập trong các rò rỉ. Đây là mức tăng 16 lần so với GPU Ampere chỉ lưu trữ 6MB bộ nhớ đệm L2. Bộ nhớ đệm sẽ được chia sẻ trên GPU.

    Cuối cùng, chúng ta có ROP cũng được tăng lên 32 trên mỗi GPC, tăng gấp 2 lần so với Ampe. Bạn đang xem tới 384 ROP trên flagship thế hệ tiếp theo so với chỉ 112 trên GPU Ampere nhanh nhất, RTX 3090 Ti. Cũng sẽ có lõi Tensor thế hệ thứ 4 và lõi RT (Raytracing) thế hệ thứ 3 mới nhất được truyền trên GPU Ada Lovelace sẽ giúp tăng hiệu suất DLSS & Raytracing lên cấp độ tiếp theo. Nhìn chung, GPU Ada Lovelace AD102 sẽ cung cấp:

    2x GPC (Versus Ampere)

    Thêm 50% số lõi (so với Ampere)

    Thêm 50% bộ nhớ đệm L1 (Versus Ampere)

    Thêm 16x bộ nhớ đệm L2 (Versus Ampere)

    Nhân đôi ROP (so với Ampere)

    Tensor thế hệ thứ 4 & lõi RT thế hệ thứ 3

    Thông số kỹ thuật NVIDIA GeForce RTX 4090 'Official'

    NVIDIA GeForce RTX 4090 sẽ sử dụng 128 SM trong số 144 SM cho tổng số 16.384 lõi CUDA. GPU sẽ được trang bị 96 MB bộ nhớ đệm L2 và tổng cộng 384 ROP, RTX 4090 là một thiết kế cắt giảm, nó có thể có số lượng L2 và ROP thấp hơn một chút. Clock speeds vẫn chưa được xác nhận nhưng xem xét rằng quy trình TSMC 4N đang được sử dụng. Tốc độ xung nhịp được đánh giá lên đến 2,6 GHz và NVIDIA tuyên bố tốc độ trên 3GHz khi ép xung. 

    Về thông số kỹ thuật bộ nhớ, GeForce RTX 4090 sẽ có dung lượng 24GB GDDR6X sẽ đạt tốc độ 21 Gbps trên giao diện bus 384-bit. Điều này sẽ cung cấp băng thông lên đến 1 TB / s. Đây là băng thông tương tự như card đồ họa RTX 3090 Ti hiện có và theo mức tiêu thụ điện năng, TBP được đánh giá ở mức 450W. RTX 4090 sẽ được cấp nguồn bởi một đầu nối 16 chân duy nhất cung cấp công suất lên đến 600W. Các mô hình tùy chỉnh sẽ cung cấp mục tiêu TBP cao hơn. 

    Hiệu năng card đồ họa NVIDIA GeForce RTX 4090

    Đối với hiệu suất của các GPU quái vật này, NVIDIA đã chia sẻ các số liệu tính toán và hiệu suất chơi game và có vẻ như GeForce RTX 4090 sẽ là thẻ chơi game đầu tiên đạt giới hạn mã lực tính toán 100 TFLOP.

    Chỉ để so sánh:

    NVIDIA GeForce RTX 4090: 90 TFLOPs (FP32) (Giả sử xung nhịp 2,8 GHz)

    NVIDIA GeForce RTX 3090 Ti: 40 TFLOPs (FP32) (Xung nhịp tăng 1,86 GHz)

    NVIDIA GeForce RTX 3090: 36 TFLOP (FP32) (xung nhịp tăng 1,69 GHz)

    Dựa trên tốc độ xung nhịp lý thuyết là 2,8 GHz, bạn nhận được tối đa 103 TFLOPs hiệu suất máy tính và các tin đồn cho thấy xung nhịp tăng cao hơn nữa. Bây giờ, chúng chắc chắn nghe giống như higher boost clocks tương tự như frequencies cao điểm của AMD cao hơn clock 'Game' trung bình. Hơn 100 TFLOPs tính toán hiệu suất có nghĩa là hơn gấp đôi mã lực so với hàng đầu 3090 Ti. Nhưng cần lưu ý rằng hiệu suất tính toán không nhất thiết chỉ ra hiệu suất chơi game tổng thể nhưng mặc dù vậy, nó sẽ là một nâng cấp lớn cho PC chơi game và tăng 8,5 lần so với bảng điều khiển nhanh nhất hiện tại, Xbox Series X.

    Đây sẽ là mức tăng hiệu suất máy tính lên gấp 2 lần và hiệu suất chơi game tăng gấp 2 lần như NVIDIA đã chứng minh cho mỗi card đồ họa so với người tiền nhiệm của nó và điều này thậm chí không tính đến hiệu suất lõi RT và Tensor, được mong đợi sẽ nhận được mức tăng lớn trong tương ứng của chúng Phòng ban. Tăng 2-4 lần so với RTX 3090 & RTX 3090 Ti sẽ rất khó.

    Các game thủ chắc chắn đang rất mong đợi sẽ có được trải nghiệm hơi game 4K sẽ mượt mà trên các card đồ họa này và với DLSS, chúng ta thậm chí có thể thấy 60 FPS có thể chơi được ở độ phân giải 8K, đây là điều mà NVIDIA đã cố gắng đạt được với các BFGPU dòng RTX 3090 của mình trong một thời gian. 

    Giá của card đồ họa NVIDIA GeForce RTX 4090

    Card đồ họa NVIDIA GeForce RTX 3090 Ti & RTX 3090 chắc chắn là GPU chip đơn đắt nhất cho đến thời điểm hiện tại. NVIDIA GeForce RTX 4090 sẽ có giá 1599 đô la Mỹ cho biến thể Founders Edition và sẽ có mặt trên thị trường vào ngày 12 tháng 10.