DeepSeek V4: Những điều bạn không nên bỏ lỡ về mô hình AI mã hóa sắp ra mắt

DeepSeek sắp ra mắt mô hình lớn tiếp theo, DeepSeek V4, còn được gọi là DeepSeek Model 1. Những người trong lĩnh vực công nghệ và lập trình đang bàn luận về những gì nó có thể làm và thời điểm nó sẽ ra mắt. Phiên bản mới dự kiến sẽ sớm được phát hành, mang đến nhiều thay đổi có thể mang lại cảm giác khác biệt so với các phiên bản trước. Trong bài viết dưới đây, bạn sẽ tìm hiểu về lộ trình và khám phá các nâng cấp chính mà nó cung cấp so với các phiên bản trước.

Mục lục

Một cái nhìn nhanh về các mô hình DeepSeek hiện tại

Hãy cùng xem tất cả các mô hình DeepSeek trước để bạn có thể hình dung những gì công ty thực sự đang tạo ra:

DeepSeek-V2 (mô hình ngôn ngữ lớn tổng quát)

Mô hình này xuất hiện vào tháng 5 năm 2024 và có tổng cộng 236 tỷ tham số, nhưng chỉ có 21 tỷ tham số hoạt động khi xử lý mỗi token. Mô hình này được xây dựng dựa trên Mixture of Experts, về cơ bản nghĩa là mô hình chọn ra các phần cụ thể của nó để xử lý các nhiệm vụ khác nhau thay vì sử dụng tất cả cùng một lúc. Điều này làm cho nó hiệu quả hơn rất nhiều.

DeepSeek-V2 có thể xử lý ngữ cảnh lên đến 128,000 token. Nó rất tốt trong các nhiệm vụ về ngôn ngữ tổng quát và lập trình. Điều tuyệt vời nhất là nó tiêu tốn ít hơn khoảng 42,5% chi phí huấn luyện so với các mô hình trước đó và sử dụng ít bộ nhớ hơn đến 93,3% trong quá trình sử dụng.

DeepSeek-V3 (mô hình ngôn ngữ lớn với khả năng suy luận mạnh mẽ)

Mô hình V3 này là một sự nâng cấp lớn. DeepSeek-V3 có tổng cộng 671 tỷ tham số, với 37 tỷ tham số kích hoạt mỗi token. Mô hình này ra mắt vào tháng 12 năm 2024 và thật sự gây bất ngờ cho mọi người.

Về hiệu suất, nó cạnh tranh với các mô hình đóng như GPT-4. Nó thực sự mạnh trong các nhiệm vụ toán học và mã hóa. Mô hình này là mã nguồn mở theo giấy phép MIT, nghĩa là bất kỳ ai cũng có thể sử dụng cho mục đích thương mại hoặc sửa đổi.

DeepSeek-V3.1 và V3.2 (các bản cập nhật với cách xử lý ngữ cảnh và hiệu suất được cải thiện)

V3.1 được coi như một bước đệm. Không có nhiều thông tin công khai về nó, nhưng về cơ bản là cải tiến trên V3.

V3.2 là mô hình chủ đạo hiện tại. Được phát hành vào cuối năm 2025. Nó giới thiệu một cái gì đó gọi là DeepSeek Sparse Attention (DSA), giúp giảm chi phí tính toán đồng thời duy trì chất lượng cao, đặc biệt là đối với các ngữ cảnh dài.

Thông qua cải tiến học tăng cường, V3.2 đạt hiệu suất ở cấp độ tương đương với GPT-5. Thực tế, họ có hai phiên bản. Phiên bản tiêu chuẩn V3.2 cân bằng và hiệu quả. Sau đó là V3.2-Speciale, tối đa hóa khả năng suy luận và sánh ngang với Gemini 3.0 Pro. Phiên bản Special thực sự đạt được hiệu suất cấp huy chương vàng trong Olympic Toán học Quốc tế năm 2025 và các cuộc thi khác.

V3.2 là mô hình đầu tiên của họ tích hợp suy luận trực tiếp vào việc sử dụng công cụ. Vì vậy, nó có thể suy nghĩ từng bước trong khi sử dụng các công cụ bên ngoài. Khá thú vị để xây dựng các tác nhân AI.

DeepSeek-R1 (mô hình tập trung vào lập luận)

R1 hoàn toàn tập trung vào lập luận. Nó sử dụng học tăng cường thuần túy mà không cần tinh chỉnh có giám sát ban đầu, cho phép mô hình tự khám phá các mẫu lập luận của riêng mình thông qua thử nghiệm và sửa lỗi. Điều này khác với cách hầu hết các mô hình được huấn luyện.

Mô hình thể hiện khả năng tự kiểm tra, phản tư và tạo ra chuỗi suy nghĩ dài. Khi giải quyết vấn đề, bạn có thể thực sự thấy được quá trình suy nghĩ của nó. Nó chia nhỏ mọi thứ theo từng bước.

Hiệu suất rất mạnh mẽ. Nó đạt khoảng 79,8% trong Kỳ thi Toán Mỹ Mở Rộng (American Invitational Mathematics Examination) và 97,3% trên MATH-500. Đối với lập trình, nó đạt xếp hạng Elo 2.029 trong các thử thách lập trình. Đó là đang cạnh tranh với mô hình o1 của OpenAI.

Phần thực sự thú vị là chi phí. Vận hành DeepSeek R1 tốn khoảng 8 đô la cho mỗi triệu token, trong khi o1 của OpenAI tốn 15 đô la cho mỗi triệu token đầu vào và 60 đô la cho mỗi triệu token đầu ra. Vì vậy, nó rẻ hơn rất nhiều.

Giống như các mô hình V3 khác, R1 được xây dựng dựa trên DeepSeek-V3-Base và hỗ trợ sử dụng thương mại theo giấy phép MIT.

Tin tức về mô hình AI viết mã sắp tới: DeepSeek V4

Ngày dự kiến phát hành DeepSeek V4

DeepSeek đang nhắm tới thời gian phát hành V4 vào giữa tháng Hai năm 2026, có lẽ vào khoảng ngày 17 tháng Hai, trùng với Tết Nguyên Đán. Đó là chiến lược thời gian mà họ đã sử dụng với mô hình R1 của họ. Điều này vẫn chưa được DeepSeek chính thức xác nhận, nhưng các báo cáo từ những người hiểu biết về dự án cho thấy khoảng thời gian này.

Công ty đã khá kín tiếng về điều này trước công chúng, nhưng các nhà phát triển theo dõi cập nhật trên GitHub và các bài nghiên cứu đã tạo ra rất nhiều sự chú ý. Phân tích mã nguồn FlashMLA của họ cho thấy một định danh mô hình mới có tên \"MODEL1\" xuất hiện 28 lần trong các tệp, điều mà mọi người cho rằng có thể là V4. Vì vậy, về cơ bản, hãy mong đợi nó sẽ ra mắt vào khoảng giữa tháng Hai, có thể trong vài tuần tới, nhưng vẫn chưa có gì chắc chắn hoàn toàn.

Các cải tiến trong kiến trúc của DeepSeek V4

DeepSeek mHC (Kết nối siêu hạn chế trên đa tạp)

DeepSeek mHC là một kiến trúc mới và phương pháp huấn luyện để làm cho các mạng neuron lớn, ví dụ như các mô hình ngôn ngữ lớn, dễ dàng và ổn định hơn khi huấn luyện. Đây là kết nối then chốt của DeepSeek để hạn chế các ma trận kết nối học được vào một đa tạp của các ma trận doubly stochastic mà các hàng và cột đều có tổng bằng 1. Điều này giữ cho quá trình huấn luyện ổn định và hoạt động tốt với các kết nối siêu hạn nhờ ngăn chặn gradient và biên độ tín hiệu không bùng nổ khi mạng sâu hơn.

Kiến trúc bộ nhớ Engram để truy xuất nhanh hơn

Một phần mới cốt lõi của DeepSeek V4 là Engram, hệ thống bộ nhớ lưu trữ các mẫu và sự kiện theo cách có thể truy xuất nhanh chóng. Mô hình có thể lấy dữ liệu đã lưu trữ sử dụng phương pháp tìm kiếm nhanh. Điều này cho phép nó ghi nhớ các chuỗi dài tốt hơn và duy trì tính nhất quán trong quá trình lý luận qua các nhiệm vụ kéo dài. Nó cũng giúp mô hình tập trung vào thông tin mới thay vì phải nhớ lại các sự kiện cũ.

Các kỹ thuật chú ý và độ chính xác tiên tiến

Mô hình bổ sung các cải tiến trong cách nó chú ý đến các phần quan trọng của đầu vào. Các phương pháp chú ý mới như chú ý rải rác cho phép mô hình xử lý các chuỗi dài mà không bị chậm quá nhiều. Các kỹ thuật độ chính xác như định dạng số hỗn hợp làm cho việc tính toán chính xác hơn trong khi sử dụng ít bộ nhớ hơn. Những thay đổi này cho phép V4 lý luận rõ ràng hơn về các vấn đề phức tạp như logic mã dài hoặc tài liệu nhiều lớp.

hỗn hợp chuyên gia

DeepSeek V4 tiếp tục sử dụng cấu trúc hỗn hợp chuyên gia (MoE). Trong thiết kế này, mô hình có nhiều mô-đun chuyên gia nhỏ và chỉ kích hoạt những mô-đun liên quan nhất đối với mỗi nhiệm vụ. Điều này cho phép hệ thống mở rộng mà không cần kích hoạt tất cả các phần mọi lúc. Với MoE, V4 vẫn duy trì hiệu quả ngay cả khi phát triển về quy mô và khả năng. Kết hợp với Engram, cấu trúc này giúp mô hình cân bằng giữa bộ nhớ và tính toán một cách mạnh mẽ.

Những khả năng chính của DeepSeek V4 vượt trội hơn các mô hình trước đó

DeepSeek model 1 sẽ là một bước nhảy lớn so với các phiên bản cũ hơn. Các nâng cấp chính được mong đợi trong mô hình mới này bao gồm:

Tập trung mạnh vào lập trình

DeepSeek V4 được thiết kế chủ yếu để phục vụ công việc kỹ thuật phần mềm. Các thử nghiệm nội bộ cho thấy V4 vượt trội hơn cả mô hình Claude và GPT trong việc tạo mã với ngữ cảnh dài. Hệ thống sẽ xử lý việc hiểu code rất dài, gỡ lỗi và tái cấu trúc trên các ngôn ngữ và hệ thống. Mô hình này sẽ hỗ trợ các nhiệm vụ như theo dõi lỗi, viết bài kiểm tra và giải thích code phức tạp. Sự tập trung này khiến nó hữu ích hơn cho các nhà phát triển so với các mô hình AI sử dụng chung.

Hỗ trợ cho ngữ cảnh dài

V4 được thiết kế để đọc và xử lý lượng văn bản hoặc mã rất lớn trong một lần. Hầu hết các mô hình AI bị hết bộ nhớ sau vài trăm ngàn token. DeepSeek V4 dự kiến sẽ hỗ trợ ngữ cảnh vượt mức 1 triệu token, cho phép xử lý toàn bộ cơ sở mã, các tài liệu dài hoặc các tập dữ liệu lớn mà không cần chia nhỏ chúng thành các phần nhỏ hơn. Điều này cải thiện tính liên tục và ngăn mô hình quên thông tin trước đó.

Cải thiện hiệu quả tính toán

Đằng sau hậu trường, V4 sử dụng các thay đổi kỹ thuật thông minh để giảm lượng tính toán cần thiết. Ví dụ, nó sử dụng phương pháp chú ý thưa để tập trung nguồn lực tính toán vào những điểm quan trọng nhất thay vì mọi tương tác có thể xảy ra. Điều này có nghĩa mô hình có thể xử lý các ngữ cảnh dài với ít bộ nhớ và năng lượng hơn.

Lý luận đa tệp tin

Một nâng cấp lớn là khả năng của mô hình trong việc hiểu cách nhiều tệp liên quan đến nhau Thay vì chỉ đọc một tệp tại một thời điểm, V4 dự kiến sẽ theo dõi các import, chức năng, định nghĩa và tham chiếu trong toàn bộ dự án Điều này cho phép nó phân tích sự phụ thuộc, phát hiện lỗi trải rộng trên nhiều tệp và đưa ra các gợi ý tái cấu trúc hoạt động trên toàn hệ thống

Đánh giá ngắn gọn về Pippit: hình dung các gợi ý của DeepSeek

Pippit là một công cụ AI cung cấp trình tạo video và công cụ thiết kế AI để tạo hình ảnh và video Vì vậy, khi bạn sử dụng DeepSeek để viết một gợi ý, ý tưởng hoặc kịch bản chi tiết, bạn có thể đưa văn bản đó vào Pippit để tạo hình ảnh hoặc video Mô hình văn bản thành hình ảnh hoặc video tiên tiến của Pippit sẽ đọc gợi ý và tạo các clip xã hội, giới thiệu sản phẩm hoặc hình ảnh câu chuyện phản ánh các gợi ý mà bạn đã tạo trong DeepSeek

Tại sao chọn Pippit để hình dung các gợi ý của DeepSeek

Phản hồi tạo video đa mô hình dựa trên các gợi ý từ DeepSeek

Pippit cho phép bạn nhập các gợi ý được tạo bởi DeepSeek với liên kết trang sản phẩm, PowerPoint hoặc video địa phương, và ngay lập tức chuyển thành các điểm nhấn sản phẩm, TikToks nổi bật, reels hấp dẫn, hoặc video meme hài hước. Nền tảng sử dụng các mô hình AI khác nhau tùy thuộc vào nhu cầu của bạn. Bạn có thể sử dụng Veo 3.1, Sora 2, chế độ Agent, hoặc chế độ Lite, chọn bất kỳ thời lượng nào và thiết lập ngôn ngữ video.

Hiển thị các gợi ý hình ảnh AI từ DeepSeek cho bất kỳ mục đích sử dụng nào

Pippit sử dụng các mô hình mới nhất, Nano Banana Pro và Seedream 4.5, để tạo ra hình ảnh chất lượng cao, tùy chỉnh từ các gợi ý văn bản đơn giản được tạo bởi các mô hình ngôn ngữ lớn như DeepSeek. Công cụ thiết kế AI hiểu ngôn ngữ rất tốt và nắm bắt ý định của bạn với chi tiết sắc nét, ánh sáng cân bằng và kết cấu rõ ràng. Bạn có thể tải lên hình ảnh tham chiếu, điều chỉnh tỷ lệ khung hình, và tùy chỉnh mọi thứ từ màu sắc đến các yếu tố cụ thể mà bạn muốn bao gồm.

Hướng dẫn chuyển các gợi ý từ DeepSeek thành video trong Pippit

Bạn có thể nhấp vào liên kết bên dưới và làm theo ba bước sau để tạo các đoạn clip trên mạng xã hội, quảng cáo, và nhiều nội dung khác với Pippit bằng các gợi ý bạn tạo ra từ DeepSeek:

Turn prompts to videos

Mở công cụ tạo video

Đầu tiên, bạn cần đăng ký tài khoản Pippit. Bạn có thể sử dụng Google, TikTok, hoặc Facebook để đăng nhập, tùy theo cách nào thuận tiện nhất cho bạn.

Khi bạn đã vào, hãy nhấp vào "Công cụ tạo video" từ bảng điều khiển điều hướng bên trái.

Bây giờ bạn sẽ thấy một trường văn bản nơi bạn nhập yêu cầu của mình được tạo bởi DeekSeek.

Tạo video của bạn từ các yêu cầu của DeepSeek

Nhấn "Thêm phương tiện và nhiều hơn nữa" nếu bạn muốn tải lên ảnh, đoạn video hoặc bất kỳ tài liệu tham khảo nào.

Nhấp vào "Chọn mô hình" để chọn mô hình của bạn dựa trên loại video bạn cần. Chế độ Lite phù hợp để tạo các video tiếp thị nhanh, chế độ Agent tốt cho việc sáng tạo, Veo 3.1 xử lý các video chân thực khá tốt, và Sora 2 dành cho nội dung được trau chuốt hơn.

Nếu bạn sử dụng chế độ Agent, bạn có thể nhấp "Tải lên video tham khảo" để chỉ cho AI phong cách bạn muốn tái tạo.

Mở "Tùy chỉnh cài đặt video" để điều chỉnh độ dài. Đặt nó theo cách phù hợp nhất với dự án của bạn, từ 15 giây đến vài phút.

Bạn cũng có thể chọn ngôn ngữ ưu tiên của mình tại đây nếu muốn phần lồng tiếng hoặc phụ đề.

Sau khi mọi thứ trông ổn, hãy nhấp vào "Tạo" và để Pippit tạo video của bạn. Nó sẽ thêm hoạt ảnh, chuyển cảnh và hiệu ứng dựa trên những gì bạn miêu tả trong lời gợi ý.

Thử lời gợi ý từ DeepSeek: Tạo một video chất lượng cao về một chú chó nhỏ nhảy múa trong phòng khách hiện đại. Khung cảnh là nội thất nhà ấm cúng với các cửa sổ lớn và ánh sáng ban mai dịu dàng chiếu bóng tự nhiên lên sàn gỗ. Con chó đứng trên hai chân sau và nhảy lắc lư sang hai bên, xoay vòng nhỏ và vẫy chân một cách nhịp nhàng. Máy quay sử dụng phong cách quay cầm tay chậm từ trái sang phải với chuyển động tự nhiên nhẹ. Phân cấp màu ấm, chuyển động chân thực, tâm trạng vui vẻ.

Xuất và chia sẻ

Chọn "Chỉnh sửa thêm" để mở trình chỉnh sửa video bên trong và cải thiện nội dung video của bạn hơn nữa.

Nhấn "Tải xuống" để lưu video vào máy tính của bạn.

Nếu bạn muốn chia sẻ ngay lập tức, hãy nhấn "Xuất bản" để tự động lên lịch và đăng video của bạn lên các nền tảng mạng xã hội như TikTok, Facebook và Instagram.

Cách chuyển yêu cầu DeepSeek thành hình ảnh trong Pippit

Thực hiện các bước sau để biến các yêu cầu hình ảnh AI do DeepSeek tạo ra cho áp phích, tờ rơi, hình nền, bài đăng trên mạng xã hội hoặc tạo tác phẩm nghệ thuật.

Turn prompts into images

Mở công cụ thiết kế AI

Nhấp vào "Studio hình ảnh" dưới "Tạo nội dung."

Nhấp vào "Thiết kế AI" dưới "Nâng cao hình ảnh tiếp thị."

Nói với DeepSeek loại hình ảnh bạn muốn, sau đó sao chép gợi ý đó và sử dụng nó trong Pippit.

Chuyển đổi gợi ý DeepSeek thành hình ảnh

Nhấp vào nút \"+\" nếu bạn muốn tải lên các hình ảnh tham khảo. Có thể bạn có ví dụ về phong cách mà bạn đang hướng tới, hoặc những yếu tố cụ thể mà bạn muốn AI sử dụng làm cảm hứng. Bước này là tùy chọn nhưng rất hữu ích.

Để chọn giữa mô hình Seedream hoặc Nano Banana, nhấp vào \"Model.\" Mỗi mô hình có những điểm mạnh khác nhau. Nếu bạn không chắc chắn nên sử dụng loại nào, cứ để ở chế độ Auto và để Pippit quyết định.

Chọn \"aspect ratio\" mà bạn cần. Hình vuông cho các bài đăng trên mạng xã hội, hình ngang cho trang web, hình dọc cho màn hình điện thoại, bất cứ gì phù hợp với dự án của bạn.

Nhấp vào \"Generate\" và đợi một chút trong khi AI của Pippit tạo hình ảnh dựa trên mọi thông tin bạn đã mô tả.

Thử gợi ý từ DeepSeek: Một chú chó chạy qua không gian công viên rộng lớn, tai bay lên giữa chuyển động, miệng hơi mở, chân mờ do tốc độ. Nền kéo dài thành những vệt xanh và nâu khi máy ảnh cố gắng giữ nét. Ánh nắng lấp lánh trên cơ thể thành những mảng sáng tối đan xen. Quay bằng tay, tốc độ màn trập nhanh nhưng theo dõi không hoàn hảo, nhiễu rõ rệt ở các khu vực có bóng tối, làm mờ chuyển động được giữ nguyên để bảo toàn tính chân thực.

Xuất hình ảnh của bạn

Kiểm tra kết quả được tạo từ lời nhắc DeepSeek. Bạn có thể điều chỉnh chi tiết lời nhắc của mình để tạo thêm hình ảnh với các phong cách khác nhau.

Tận dụng các công cụ bên trong để tinh chỉnh nội dung hình ảnh của bạn theo nhu cầu.

Nhấp vào "Tải xuống" để lưu hình ảnh vào thiết bị cục bộ của bạn.

Kết luận

Vậy hãy cùng tóm lại những gì chúng ta đã đề cập ở đây. Chúng ta đã xem xét dòng sản phẩm hiện tại của DeepSeek và khám phá những gì sẽ xuất hiện với V4, một bản nâng cấp đáng kể với cửa sổ ngữ cảnh một triệu token, kiến trúc bộ nhớ Engram, và sự tập trung mạnh mẽ vào các nhiệm vụ mã hóa. Những cải tiến này khiến nó trở nên vượt trội hơn trong việc xử lý các dự án phức tạp và bộ dữ liệu lớn. Điều này rõ ràng cho thấy rằng DeepSeek đã tiến xa chỉ trong vài năm. Hiện giờ nó là công cụ hàng đầu cho các nhiệm vụ mã hóa nghiêm túc, nghiên cứu và giải quyết vấn đề.

Câu hỏi thường gặp

Điều gì đặc biệt về mô hình DeepSeek v3?

Mô hình DeepSeek V3 nổi bật với khả năng xử lý các đầu vào rất lớn, với cửa sổ ngữ cảnh lên đến 128K token, cho phép nó đọc và suy luận qua các tài liệu hoặc cơ sở mã dài. Nó sử dụng thiết kế Mixture-of-Experts (MoE), giúp nó hoạt động nhanh và hiệu quả bằng cách chỉ kích hoạt các phần của mô hình khi cần thiết. V3 cũng có bộ nhớ phân cấp để ghi nhớ thông tin quan trọng, hệ thống neo sự thật nhằm giảm lỗi, và các kỹ thuật đào tạo tiên tiến cải thiện chất lượng văn bản và hiệu suất.

Những mô hình nào được bao gồm trong danh sách mô hình DeepSeek?

Danh mục mô hình DeepSeek bao gồm V2 để cải thiện ngữ cảnh và lập luận, V3 với cửa sổ 128K-token và MoE, và V3.1 để tăng cường khả năng lập luận chuyên sâu. Cũng có mô hình V3.2-Speciale, hoạt động tốt cho các tác vụ lập luận và giải quyết vấn đề ở cấp độ thi đấu. Dòng R1 tập trung vào lập luận logic từng bước.

Làm thế nào để DeepSeek xử lý các tác vụ ngữ cảnh dài?

Mô hình AI DeepSeek xử lý ngữ cảnh dài thông qua các cơ chế chú ý thưa, chọn chỉ các token liên quan nhất thay vì so sánh mọi thứ với nhau. Điều này làm cho việc xử lý ngữ cảnh dài nhanh hơn nhiều, đồng thời cung cấp đầu ra chất lượng cao. V3.2 và phiên bản V4 sắp tới có thể xử lý hơn một triệu token, nghĩa là chúng có thể làm việc với toàn bộ cơ sở mã hoặc tài liệu lớn chỉ trong một lần.

DeepSeek V4 có phải là mã nguồn mở không?

Hiện tại, DeepSeek chưa xác nhận chính thức liệu V4 có hoàn toàn là mã nguồn mở hay không. Tuy nhiên, DeepSeek có xu hướng rõ ràng trong việc công khai các mô hình và trọng số của mình. Vì vậy, dựa trên lịch sử của họ với V2, V3 và R1, rất có khả năng V4 sẽ theo cùng một xu hướng khi được phát hành vào giữa tháng Hai.

Các mô hình của DeepSeek có thể được sử dụng cục bộ không?

Có, bạn có thể chạy các mô hình của DeepSeek cục bộ. V3 và V3.1 có trọng số mở mà bạn có thể tải xuống và chạy trên CPU hoặc GPU của mình. Phiên bản nhỏ hơn được tinh chỉnh từ R1, như các mô hình với tham số 7B, 14B, và 32B, hoạt động trên phần cứng phổ thông tiêu dùng. V4 dự kiến sẽ chạy trên hai RTX 4090 hoặc một RTX 5090 nhờ vào thiết kế Mixture-of-Experts của nó.

Generate with DeepSeek prompts

Mọi điều chúng tôi biết về DeepSeek V4 sắp ra mắt