Tóm tắt ngắn: NVIDIA cho rằng thiết kế phần cứng cho trí tuệ nhân tạo đòi hỏi đồng thiết kế xuyên suốt toàn bộ stack. Bài phát biểu tại hội nghị Humax X ở San Francisco đã nhấn mạnh ba điểm: sự đồng tiến hóa giữa chip và phần mềm, rủi ro trong việc lựa chọn những gì cần tăng tốc và vai trò của Nemotron như một dự án mở để đọc xu hướng AI.
Tại bài phát biểu khai mạc của hội nghị Humax X ở San Francisco, một câu hỏi trung tâm cho ngành đã được nêu ra: làm thế nào để thiết kế hardware AI NVIDIA trong bối cảnh phần mềm thay đổi triệt để mỗi sáu tháng?
Đối với NVIDIA, chủ đề này không chỉ là lý thuyết. Theo như giải thích trong bài phát biểu, nó đại diện cho trọng tâm công việc của công ty trong hơn 30 năm. Trong lĩnh vực AI, các mô hình, framework, thư viện và phương pháp triển khai phát triển nhanh chóng. Vì lý do này, một tầm nhìn chỉ giới hạn ở chip là không đủ.
Thay vào đó, cần có một chiến lược phối hợp phần cứng và phần mềm dọc theo toàn bộ stack công nghệ. Đây là luận điểm chính xuất hiện từ bài phát biểu.
Câu trả lời được NVIDIA đưa ra là đồng thiết kế, tức là đồng thiết kế phần cứng và phần mềm. Nó không chỉ liên quan đến một cấp độ của cơ sở hạ tầng. Ngược lại, nó bao gồm transistor, chip, kiến trúc tính toán, trình biên dịch, thư viện, framework phần mềm, tập dữ liệu, thuật toán AI và mạng lưới.
Về mặt công nghiệp, hiệu quả không chỉ đến từ sức mạnh của silicon. Nó cũng phụ thuộc vào khả năng điều chỉnh tất cả các thành phần biến một mô hình thành một hệ thống thực sự có thể thực thi, tối ưu hóa và phân phối trên quy mô.
Do đó, lợi thế cạnh tranh không chỉ đến từ việc xây dựng phần cứng tiên tiến. Nó cũng đến từ khả năng phát triển nó cùng với phần mềm sẽ khai thác nó.
Một trong những đoạn quan trọng nhất của bài phát biểu liên quan đến việc lựa chọn ưu tiên. Thiết kế phần cứng cho AI không chỉ có nghĩa là tăng hiệu suất theo nghĩa chung. Nó có nghĩa là quyết định những vấn đề nào cần tăng tốc, những công nghệ nào được ưu tiên và hướng nào được coi là có khả năng nhất cho sự phát triển tương lai của trí tuệ nhân tạo.
Lựa chọn này mang theo rủi ro cao. Nếu thị trường và nghiên cứu di chuyển theo hướng khác với dự đoán, đầu tư vào một kiến trúc cụ thể hoặc các tối ưu hóa cụ thể có thể mất giá trị rất nhanh chóng.
Theo như xuất hiện trong bài phát biểu, NVIDIA áp dụng một chiến lược tập trung cao. Công ty không hướng đến đa dạng hóa rộng rãi. Ngược lại, tập trung nguồn lực vào một hướng chính xác. Công thức được trình bày trong bài phát biểu rất rõ ràng: hoặc dự án thành công, hoặc thất bại hoàn toàn.
Đối với các chuyên gia trong ngành, điểm này rất quan trọng. Thiết kế phần cứng cho AI không còn chỉ là vấn đề kỹ thuật. Nó cũng là một bài tập phân bổ chiến lược vốn, tài năng và thời gian phát triển.
Nhìn thoáng qua, một chiến lược không đa dạng hóa có thể trông quá lộ liễu. Tuy nhiên, NVIDIA cho rằng sự đồng tiến hóa giữa phần mềm và phần cứng làm giảm một phần rủi ro này.
Nếu các nhà phát triển, framework và hệ thống ứng dụng dần dần liên kết với các lựa chọn kiến trúc của phần cứng, nó tạo ra hiệu ứng củng cố lẫn nhau. Nói cách khác, phần cứng ảnh hưởng đến phần mềm và phần mềm củng cố tầm quan trọng của phần cứng.
Cơ chế này đặc biệt quan trọng trong AI. Trình biên dịch, thư viện và framework thực sự có thể quyết định việc áp dụng thực tế của một nền tảng. Do đó, đồng thiết kế không chỉ phục vụ để cải thiện hiệu suất, mà còn để xây dựng một quỹ đạo hệ sinh thái.
Trong bối cảnh này, Nemotron được đưa vào, được trích dẫn như dự án chính để hiểu sự phát triển của AI và hướng dẫn thiết kế phần cứng tương lai. Theo bài phát biểu, ý tưởng là phát triển các mô hình mở để quan sát tốt hơn các hướng đi của ngành và nghiên cứu.
Một yếu tố quan trọng là các mô hình của Nemotron sau đó được công khai. Khía cạnh này có giá trị kép. Một mặt, mở rộng sự sẵn có của các công cụ mở. Mặt khác, cho phép NVIDIA duy trì liên hệ trực tiếp hơn với các xu hướng kỹ thuật mới nổi.
Về mặt thực tế, Nemotron được trình bày như một cảm biến chiến lược cũng như một sáng kiến công nghệ. Nó không chỉ là một dự án mô hình. Nó cũng là một cách để đọc trước những tải trọng, kiến trúc và mẫu suy luận nào có thể trở nên trung tâm trong chu kỳ tiếp theo của AI.
Một đoạn quan trọng khác liên quan đến sự thay đổi ưu tiên trong ngành AI. Theo bài phát biểu, sự chú ý đang chuyển từ việc chỉ tạo mô hình sang xây dựng hệ thống hoàn chỉnh cho suy luận và triển khai quy mô lớn.
Đây là một quá trình chuyển đổi quan trọng. Trong giai đoạn đầu của cơn bùng nổ AI hiện tại, phần lớn cuộc tranh luận tập trung vào khả năng đào tạo và kích thước của các mô hình. Ngày nay, ngược lại, giá trị kinh tế ngày càng phụ thuộc vào khả năng đưa các mô hình đó vào sản xuất, làm cho chúng hoạt động đáng tin cậy, kiểm soát độ trễ và chi phí và tích hợp chúng vào cơ sở hạ tầng phân tán.
Sự chuyển đổi này có tác động trực tiếp đến phần cứng, mạng lưới và phần mềm hệ thống. Suy luận quy mô thực sự đòi hỏi sự cân bằng khác so với đào tạo. Hiệu quả năng lượng, sắp xếp, tối ưu hóa thư viện, quản lý lưu lượng dữ liệu và tích hợp hoạt động trở thành các yếu tố quyết định.
Đối với các kỹ sư và doanh nghiệp, thông điệp rất rõ ràng: lợi thế cạnh tranh tương lai sẽ không chỉ phụ thuộc vào chất lượng của mô hình, mà vào chất lượng của hệ thống làm cho nó có thể sử dụng trong sản xuất.
Bài phát biểu của NVIDIA mô tả một tầm nhìn về AI ngày càng ít phân mảnh. Chip, phần mềm, mô hình mở, toolchain và cơ sở hạ tầng mạng được coi như các phần của một kiến trúc công nghiệp duy nhất.
Đối với các nhà sản xuất phần cứng, điều này nâng ngưỡng độ phức tạp cạnh tranh. Không còn đủ để thiết kế các thành phần xuất sắc. Cần phải đưa chúng vào một hệ sinh thái nhất quán. Đối với các nhà phát triển phần mềm, thay vào đó, nó có nghĩa là làm việc ngày càng gần với các ràng buộc và cơ hội của cấp độ cơ sở hạ tầng.
Cuối cùng, đối với cộng đồng AI, các dự án như Nemotron cho thấy cách phát triển mô hình mở cũng có thể có chức năng chiến lược định hướng công nghệ.
Tuy nhiên, vẫn còn một giới hạn thông tin. Bài phát biểu không cung cấp dữ liệu định lượng về hiệu suất, lộ trình hoặc trạng thái tiến độ của các dự án được trích dẫn. Ngoài ra, nó không bao gồm các tiếng nói độc lập hoặc phê bình bên ngoài. Cũng cần lưu ý rằng tên của hội nghị xuất hiện dưới dạng không rõ ràng giữa Humax X và HUMANX.
NVIDIA khẳng định rằng thiết kế phần cứng cho AI không có nghĩa là theo đuổi phần mềm. Nó có nghĩa là đồng tiến hóa với nó dọc theo toàn bộ stack công nghệ.
Theo bài phát biểu, chiến lược này dựa trên ba trụ cột: đồng thiết kế, lựa chọn tập trung các ưu tiên và sử dụng các dự án mở như Nemotron để dự đoán xu hướng.
Thông điệp cuối cùng rất rõ ràng: trong AI, giá trị không chỉ phụ thuộc vào chip hoặc mô hình, mà vào hệ thống hoàn chỉnh kết hợp phần cứng, phần mềm và triển khai quy mô.


