Thứ Tư, 29 tháng 1, 2025
Các ông lớn AI đang 'hoảng sợ' thế nào trước DeepSeek Trung Quốc
DeepSeek cho thấy AI Trung Quốc không thua kém của Mỹ. Ảnh: X Screengrab
Các ông lớn AI đang 'hoảng sợ' thế nào trước DeepSeek Trung Quốc
Sau khi DeepSeek công bố 'AI giá rẻ', vốn hóa Nvidia sụt gần 600 tỷ USD, còn Meta lập "phòng chiến tranh" để giải mã mô hình đang thay đổi cuộc chơi của Trung Quốc.
AI đã đưa Nvidia trở thành một trong hai công ty giá trị nhất thế giới với vốn hóa thị trường hơn 3.500 tỷ USD. Tuy nhiên, theo Fortune, trong ngày 27/1, "sự hoảng loạn của các nhà đầu tư Nvidia" khiến cổ phiếu của công ty giảm gần 17% và xóa sổ gần 600 tỷ giá trị, đưa vốn hóa công ty xuống dưới mốc 3.000 tỷ USD.
Đợt bán tháo được kích hoạt bởi DeepSeek. Ngày 20/1, công ty khởi nghiệp Trung Quốc công bố mô hình AI V3 miễn phí và đặc biệt R1 "được đào tạo trên các chip cũ của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự". Công ty cho biết họ chỉ mất hai tháng và chi phí dưới 6 triệu USD để xây dựng mô hình AI sử dụng chip H800 kém tiên tiến của Nvidia. Phiên bản V3 thậm chí vượt ChatGPT trở thành ứng dụng được tải nhiều nhất trên App Store tại Mỹ ngày 27/1. Hai năm qua, những GPU mạnh mẽ nhưng đắt đỏ của Nvidia được săn đón để xây dựng mô hình AI tiên tiến nhất. Do đó, các nhà đầu tư lập tức đặt câu hỏi về tương lai của Nvidia. Theo Shubham Saboo, Giám đốc sản phẩm của DeepSeek, OpenAI o1 mất 60 USD cho một triệu token đầu ra, còn DeepSeek R1 chỉ cần 2,19 USD
"Về cơ bản, điều này giống như ai đó phát hành điện thoại có sức mạnh bằng với iPhone, nhưng bán với giá 30 USD thay vì 1.000 USD", Arnaud Bertrand, người sáng lập HouseTrip và Me & Qi, nói.
Dù còn nhiều điều chưa được giải đáp về cách DeepSeek phát triển mô hình của mình, công ty mới nổi này đang làm rung chuyển thị trường AI. Những tỷ phú có tài sản liên quan đến trí tuệ nhân tạo thiệt hại nhiều nhất trong ngày đầu tuần, như CEO Nvidia Jensen Huang chứng kiến tài sản giảm 20,1 tỷ USD, nhà sáng lập Oracle Larry Ellison giảm 22,6 tỷ USD, CEO Michael Dell mất 13 tỷ USD còn nhà đồng sáng lập Binance Changpeng Zhao sụt 12,1 tỷ USD.
Trong khi đó, theo The Information, Mark Zuckerberg, CEO Meta, đã đưa ra tình trạng báo động cao và tập hợp kỹ sư vào bốn "phòng chiến tranh" để xác định cách High-Flyer, một trong những quỹ đầu tư hàng đầu Trung Quốc, tài trợ toàn phần cho DeepSeek để phát hành một công cụ thay đổi cuộc chơi AI.
Cách sử dụng mã nguồn mở đột phá cũng khiến giới chuyên gia đặt câu hỏi về các khoản đầu tư khổng lồ vào AI của hàng loạt công ty Mỹ. Mathew Oldham, Giám đốc cơ sở hạ tầng AI của Meta, nhận xét mô hình mới của DeepSeek có thể vượt trội hơn phiên bản tiếp theo của Llama AI, dự kiến phát hành đầu 2025. Còn Yann LeCun, Giám đốc khoa học AI của Meta, đánh giá thành công của DeepSeek cho thấy mô hình AI nguồn mở đang vượt mặt sản phẩm độc quyền.
Logo các ứng dụng AI DeepSeek, Copilot, ChaGPT, Gemini trên điện thoại. Ảnh: Lưu Quý
Một nhân viên ẩn danh cho biết trong số bốn phòng chiến tranh Meta tạo ra để ứng phó với bước đột phá của DeepSeek, hai phòng sẽ cố gắng giải mã cách High-Flyer giảm chi phí đào tạo và vận hành DeepSeek, từ đó áp dụng cho Llama.
Phòng thứ ba sẽ tìm hiểu dữ liệu nào DeepSeek sử dụng để đào tạo mô hình, trong khi nhóm còn lại xem xét Llama có thể tái cấu trúc như thế nào dựa trên các thuộc tính của mô hình DeepSeek.
Phát ngôn viên Meta sau đó trả lời The Information: "Chúng tôi vẫn thường xuyên đánh giá tất cả mô hình cạnh tranh trong quá trình phát triển và đã làm như vậy kể từ khi bộ phận GenAI của công ty thành lập". Tuần trước, Meta thông báo chi 65 tỷ USD cho các dự án liên quan đến AI trong năm, như xây dựng một trung tâm dữ liệu khổng lồ và tuyển dụng thêm nhiều nhân viên AI.
Hai mô hình DeepSeek trình làng cũng cùng giai đoạn OpenAI hợp tác SoftBank, Oracle và các công ty khác để thực hiện siêu dự án cơ sở hạ tầng AI trị giá 500 tỷ USD, được Nhà Trắng hậu thuẫn mang tên Stargate, với mục tiêu thành lập hàng chục trung tâm dữ liệu mới trên khắp nước Mỹ.
"Những thành tựu về hiệu quả của Trung Quốc không phải là ngẫu nhiên", Angela Zhang, giáo sư luật tại Đại học Nam California nói trên Financial Times. "Khi hạn chế quyền tiếp cận của Trung Quốc đối với chip AI tiên tiến, Mỹ vô tình thúc đẩy sự đổi mới của nước này".
″Mô hình DeepSeek thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình nguồn mở có khả năng suy luận, đạt được hiệu quả tính toán siêu việt", CEO Microsoft Satya Nadella nói tại Diễn đàn Kinh tế Thế giới ở Davos ngày 22/1. "Chúng ta nên xem xét những diễn biến ở Trung Quốc một cách rất, rất nghiêm túc".
DeepSeek được Liang Wenfeng thành lập tháng 5/2023, đặt trụ sở ở Hàng Châu, Chiết Giang, và do quỹ đầu tư High-Flyer sở hữu. Công ty được High-Flyer tài trợ và không có kế hoạch huy động vốn, tập trung vào xây dựng công nghệ nền tảng.
Theo ChinaTalk, không giống các công ty AI tại Trung Quốc, DeepSeek tuyên bố sứ mệnh "giải mã bí ẩn của siêu trí tuệ nhân tạo AGI bằng sự tò mò". Phòng thí nghiệm của công ty hiện tập trung nghiên cứu cải tiến về kiến trúc và thuật toán có khả năng thay đổi cuộc chơi trong lĩnh vực trí tuệ nhân tạo.
Người Trung Quốc ăn mừng thành công của DeepSeek
DeepSeek và nhà sáng lập Liang Wenfeng được ca ngợi có tầm nhìn xa, có thể mở ra làn sóng công nghệ Trung Quốc cạnh tranh với Thung lũng Silicon.
"DeepSeek lật đổ thị trường chứng khoán Mỹ chỉ sau một đêm" là hashtag với hàng chục triệu lượt xem trên mạng xã hội Weibo tại Trung Quốc hai ngày qua, theo CNN. Hơn 10 hashtag liên quan khác cũng trở thành xu hướng sau khi DeepSeek vươn lên dẫn đầu bảng xếp hạng ứng dụng tại nhiều thị trường, vượt qua cả "tượng đài" ChatGPT của OpenAI.
"DeepSeek khiến Meta hoảng loạn", một bình luận khác được lan truyền, ám chỉ gã khổng lồ công nghệ Mỹ chi tiền tỷ vào AI nhưng vẫn phải lo sợ trước startup trẻ tuổi. Liang Wenfeng, người đứng sau DeepSeek, được tán dương có tầm nhìn xa, giúp Trung Quốc mở ra làn sóng công nghệ mới có thể cạnh tranh với Thung lũng Silicon.
Liang Wenfeng (phải) phát biểu tại một hội nghị ở Bắc Kinh (Trung Quốc) ngày 20/1. Ảnh: CCTV
Từ kỹ sư chuyển sang làm doanh nhân, Liang hiếm khi trả lời phỏng vấn nhưng được biết đến với việc chỉ tuyển dụng nhân tài trong nước và đi theo hướng AI mã nguồn mở, cho phép các công ty hoặc người dùng khác thử nghiệm và phát triển dựa trên mô hình của mình.
Liang, nhà đồng sáng lập quỹ đầu tư định hướng AI High-Flyer Quant, thành lập DeepSeek năm 2023. Mô hình mới nhất của công ty khởi nghiệp là DeepSeek R1 ra mắt ngày 20/1 được đánh giá sánh ngang với các đối thủ nổi tiếng của Mỹ, gồm GPT-4 của OpenAI, Llama của Meta và Gemini của Google. Công ty tuyên bố chi phí xây dựng chưa đến 6 triệu USD, chỉ bằng một phần nhỏ so với khoản đầu tư từ các công ty khác.
Nhà đầu tư công nghệ nổi tiếng Marc Andreessen ca ngợi đây là "khoảnh khắc Sputnik". Tổng thống Mỹ Donald Trump cũng gọi bước đột phá mới là "lời cảnh tỉnh" cho nước Mỹ. Sự thống trị về công nghệ, đặc biệt trong lĩnh vực AI, đã trở thành chiến trường chính giữa hai cường quốc. Mỹ những năm gần đây hạn chế các công ty Trung Quốc tiếp cận công nghệ chip tiên tiến nhằm kìm hãm sự phát triển AI ở nước này.
Do đó, với nhiều người Trung Quốc, thành công cũng như tầm nhìn và tinh thần của Liang đối với DeepSeek đánh dấu một bước tiến đáng kể của đất nước trên đấu trường quốc tế đầy cạnh tranh.
"Bất kể những người bảo thủ có quyền lực đến đâu, họ cũng có thể bị lật đổ chỉ sau một đêm", một bình luận đắc thắng trên Weibo nhận được hơn một nghìn lượt thích.
"Những thành tựu của Liang có thể được gọi là vận mệnh quốc gia", một người khác cho hay.
Thay đổi luật chơi
Sinh ngày 22/5/1985, Liang là con trai của một giáo viên tiểu học, lớn lên tại thành phố nhỏ ở tỉnh Quảng Đông, miền nam Trung Quốc. Ông tiếp tục học ngành kỹ thuật thông tin và điện tử tại Đại học Chiết Giang, ngôi trường danh tiếng ở trung tâm công nghệ phía đông Hàng Châu. Những cộng sự đầu tiên của Liang mô tả ông là mọt sách với "kiểu tóc khủng khiếp", theo Yicai.
Nhà sáng lập DeekSeek từng nhắc đến ý tưởng đào tạo mô hình AI lớn "thay đổi luật chơi" nhưng không cộng sự nào để tâm, bởi họ cho rằng suy nghĩ táo bạo như vậy thường chỉ khả thi với các gã khổng lồ công nghệ Trung Quốc như ByteDance hoặc Alibaba.
Liang đồng sáng lập quỹ High-Flyer năm 2015, chưa đầy một thập kỷ sau khi hoàn thành chương trình đại học. Theo trang web công ty, quỹ kết hợp các mô hình học máy AI vào hoạt động của mình.
Cùng lúc, công ty cũng tích lũy sức mạnh tính toán vào siêu máy tính AI có kích thước bằng một sân bóng rổ và trở thành một trong những công ty hàng đầu Trung Quốc về khả năng xử lý dù không phải là một gã khổng lồ công nghệ, theo The Paper.
Ứng dụng DeepSeek trên App Store. Ảnh: Tuấn Hưng
Khi thành lập DeepSeek, Liang muốn tập trung vào phát triển trí tuệ nhân tạo với mong muốn cải tổ văn hóa đổi mới sáng tạo của Trung Quốc. "Chúng ta thường nói có khoảng cách một hoặc hai năm giữa Trung Quốc và Mỹ, nhưng khoảng cách thực sự là giữa tính độc đáo và sự bắt chước. Nếu điều này không thay đổi, Trung Quốc sẽ luôn là kẻ đi sau", Liang nói trong một cuộc phỏng vấn hiếm hoi với hãng truyền thông Trung Quốc 36Kr tháng 7 năm ngoái.
Tuy nhiên, nhà sáng lập DeepSeek vẫn bày tỏ sự lạc quan về khả năng cạnh tranh của Trung Quốc trong tương lai. "Khi xã hội chấp nhận những nhà cải cách cứng rắn thành công, tư duy tập thể sẽ thay đổi. Chúng ta cần những ví dụ và quy trình cụ thể hơn", ông nói.
"Chúng tôi không làm việc tầm thường"
Theo truyền thông Trung Quốc, DeepSeek có văn phòng làm việc ở Bắc Kinh và Hàng Châu với gần 140 nhà nghiên cứu và kỹ sư, kém xa các công ty lớn ở Trung Quốc và Mỹ trong lĩnh vực AI. Nhân viên DeepSeek được tuyển dụng trong nước và nhiều người là những sinh viên mới tốt nghiệp hoặc nghiên cứu sinh từ các trường đại học hàng đầu Trung Quốc.
"50 tài năng hàng đầu có thể không ở Trung Quốc, nhưng chúng ta có thể tự tạo ra những người như vậy", ông nói với 36Kr và cho biết công việc được chia dựa theo thế mạnh của mỗi người. "Đổi mới trước tiên đòi hỏi sự tự tin. Sự tự tin đó thường rõ ràng hơn ở những người trẻ tuổi", ông nói thêm.
Zihan Wang, cựu nhân viên DeepSeek đang du học tại Mỹ, cho biết công ty đem đến "sự xa xỉ" mà ít sinh viên mới tốt nghiệp có được, như quyền truy cập nguồn tài nguyên máy tính cũng như sự tự do được thử nghiệm, theo MIT Technology Review.
DeepSeek vẫn đang tuyển dụng các nhà nghiên cứu học sâu, kỹ sư và nhà thiết kế giao diện người dùng. Các vị trí kỹ sư được trả cao nhất hàng tháng 90.000 nhân dân tệ (12.400 USD). Để so sánh, lương ở mức cao cho kỹ sư phần mềm Google là khoảng 29.000 USD, theo Levels.fyi.
Theo một bài đăng trên Wechat của DeepSeek, mục tiêu của công ty là "khám phá bản chất của siêu trí tuệ nhân tạo tổng quát AGI". "Chúng tôi không làm những việc tầm thường và trả lời những câu hỏi lớn nhất bằng sự tò mò và tầm nhìn xa", bài đăng có đoạn.
Nguồn: Các ông lớn AI đang 'hoảng sợ' thế nào trước DeepSeek Trung Quốc
Đăng ký:
Đăng Nhận xét (Atom)
Không có nhận xét nào:
Đăng nhận xét
Những người bạn