Kể từ cuối năm 2022, AI phát triển như vũ bão và được ứng dụng khắp các lĩnh vực. Những AI tiên tiến tăng nhanh không chỉ về số lượng, mức độ “thông minh” và tốc độ phản hồi mà cả về phạm vi và mức độ ứng dụng, cũng như dịch chuyển mô hình và nền tảng. Tích hợp AI trở thành xu thế chủ đạo ứng dụng ngày càng sâu rộng trong các lĩnh vực, từ khoa học công nghệ, sản xuất, kinh doanh, đến quân sự và các khía cạnh đời sống.
Trong 3 năm (3/2023 - 3/2026), Thế giới đã chuyển dịch từ việc "tò mò về AI" (2023) sang "thực thi AI" (2024), "đa dạng hóa AI" (2025) và "AI hiện diện ở mọi nơi" (2026), sẽ song hành cùng AGI vào 2030. Các AI ngày càng có tính phổ quát hơn, hoạt động thực tế tốt hơn, được ứng dụng vào nhiều lĩnh vực hơn. Từ cuối năm 2023, Thế giới rất sôi động về cách áp dụng AI ở các vai trò thực hiện, định hình hay sản xuất trong các ngành, lĩnh vực.
Ví dụ, Microsoft triển khai tích hợp AI Copilot vào Window 11, Office 365 và Edge phát hành từ 26/9/2023. Ước tính các tính năng AI có thể mang lại doanh thu lũy kế 99 tỉ USD cho Microsoft vào năm 2027. OpenAI đưa ra loạt công cụ tạo chatbot nghiệp vụ văn phòng tùy chỉnh cho doanh nghiệp dựa trên các mô hình AI từ GPT-4 (3/2023) đến GPT-5.4 (2/2026). Hay Google từ 8/2024, tích hợp AI Gemini vào các ứng dụng Gmail, Maps, YouTube, Trang tính và sản phẩm khác, cung cấp những tính năng mở rộng và tự động cho các ứng dụng.
Hoặc Intel Aurora genAI công bố tại ISC2023, phục vụ nghiên cứu khoa học với 1000 tỉ tham số như: cho phép tạo ra báo cáo, dữ liệu khoa học và những dòng code cho tìm cách chữa ung thư, giải quyết biến đổi khí hậu, nghiên cứu vũ trụ, nghiên cứu vật liệu mới,…
Người dùng toàn cầu đang viết thuyết trình, viết báo cáo, làm văn, viết thơ; hay soạn lịch trình chuyến du lịch với hình ảnh các điểm tham quan; hay chuyển văn bản thành giọng đọc; hoặc chuyển video thành văn bản và âm thanh bằng các chatbot như OpenAI ChatGPT, Google Gemini, Anthropic Claude, xAI Grok, Qwen, Kimi, GLM, Ernie, hay Amazon Nova...
Họ vẽ tranh, tạo ảnh bằng những AI “Text to Image” như Google Imagen 3.0 (10/2024), Ideogram 3.0 (3/2025), Seedream 3.0 (4/2025), FLUX.1 Kontext (5/2025), GPT Image-1 (4/2025), Google Imagen 4.0 (6/2025), nhất là bằng Gemini-3.0 Pro-image (Nano Banana), ChatGPT Image latest high (12/2025). Hoặc phát triển Website bằng các AI WebDev.
Hay tạo video đến 4K, đa dạng phong cách với các nhân vật thể hiện cảm xúc sinh động được đồng bộ âm thanh, bằng những AI “Text to Video” hoặc bằng AI “Image to Video”, như OpenAI Sora (12/2024), Pika-v2.2 (02/2025), Kling-v2.1-master (5/2025), Hailuo-02 Pro (6/2025), Wan-v2.2-a14b (7/2025),... Nhất là với Google Veo 2 (12/2024)/ Veo-3 (6/2025)/ Veo-3.1 (10/2025), OpenAI Sora-2 (9/2025), Grok-imagine-video (8/2025),...
Hoặc viết code tự động với công cụ AI, như nguồn mở Meta Code Llama-70B phát hành 12/2023, BLOOM 176B (7/2022); Cho doanh nghiệp có: Anysphere Cursor ra năm 2023 với tùy chọn mô hình, Microsoft VS Code (2023-2024) vận hành với mô hình AI GPT-4/4o, Google Alpha Code phát hành 3/2024 hoạt động với các mô hình AI Gemini Pro 1.5/ 2.0/ 2.5 và 3.0. Viết code chuyên nghiệp năm 2022 có các công cụ AI Amazon Code Whisperer, GitHub Copilot và Copilot Workspace; công cụ viết code OpenAI Agent Codex hoạt động từ 5/2025 với mô hình AI GPT-o3, và công cụ Anthropic Claude Code hoạt động với mô hình AI Claude Opus 4.1 (8/2025)/ Sonnet 4.5 (9/2025) có khả năng viết code liên tục 23-30 giờ...
Ấn tượng, mạng xã hội AI đầu tiên OpenAI Sora 2 ra mắt 10/9/2025, giúp chia sẻ nhanh video ngắn nội dung AI với phong cách như TikTok hay Meta Reels, YouTube Short. Hay trình duyệt ChatGPT Atlas phát hành 10/2025 thách thức sự thống trị của Google Chrome...
Những AI tiên tiến hiện nay trở thành giao tiếp AI đàm thoại có khả năng hiểu và phản hồi tự nhiên, chính xác và sáng tạo hơn cho người dùng thiết bị Androi, Windows, macOS và iOS, cạnh tranh với các trợ lý ảo truyền thống như Google Assistant, Apple Siri và Amazon Alexa. Ví dụ, Samsung đi đầu tích hợp AI Google Gemini 1.8B vào smartphone từ Galaxy S24. Apple thì đưa ChatGPT vào iPadOS18 từ 6/2024 và macOS từ 11/2024, và cũng tích hợp AI Gemini vào iOS19 (6/2025) và iOS26 (10/2025).
Những lĩnh vực chuyên sâu cũng đang tăng mạnh ứng dụng các AI tiên tiến. Chẳng hạn, ứng dụng để khai thác các nguồn dữ liệu bản đồ, tạo ra, vận hành, phát hành và sử dụng các sản phẩm bản đồ, như mô hình AI không gian địa lý (GeoAI) triển khai trong ArcGIS Pro từ năm 2014-2015; mạng nơ-ron tích chập (Convolutional Neural Network - CNN) trong dự án Microsoft & Bing Maps AI Lab, Google Project Ground Truth và OpenStreetMap từ năm 2014-2015; mạng đối nghịch tạo sinh có điều kiện (Conditional Generative Adversarial Network - CGAN) trong tạo bản đồ chuyên dụng từ 2015-2016; AI sinh tổng hợp (Synthesis) cho xây dựng bản đồ REM và Traffic từ năm 2022 ở Bắc Mỹ; AI tạo sinh như Immersive View và Gemini Q&A tăng ứng dụng trên Google Maps/Earth từ năm 2024 ở Bắc Mỹ; và các tác nhân AI (agentic) đã được sử dụng trong các dự án xây dựng bản đồ như dự án Overture Maps Foundation và Global Entity Reference System năm 2024-2025 ở Bắc Mỹ.
Những AI tiên tiến cũng được tăng mạnh sử dụng trong quân sự, như mô hình Claude của Anthropic được tùy chỉnh để sử dụng trong chiến dịch đặc biệt của Mỹ tại Venezuela tháng 01/2026, và đang được sử dụng trong cuộc chiến với Iran từ 28/2/2026.
Trong khi các ứng dụng AI chạy với mô hình hàng đầu trên xếp hạng LMArena hiện nay (bảng 5) như Gemini 3.0 Pro/ 3.1 Pro, Claude Opus 4.5/ 4.6, Grok 4.1/ 4.2 và GPT-5.4 High có khả năng thực hiện các tác vụ phức tạp như lập kế hoạch, viết nâng cao, hiểu và tóm tắt nội dung hiệu quả, vượt chuyên gia con người, vượt các mô hình GPT-5.0-5.1 High ở nhiều thử nghiệm trong khoa học, y học, kinh doanh và giáo dục, đặc biệt vượt trội hơn về suy luận toán học, phân tích dữ liệu khoa học và thực hiện viết code nâng cao.
Sự cạnh tranh trong không gian AI ngày càng quyết liệt, không chỉ với các bigtech như Microsoft, Google, Meta, Amazon từ Mỹ; Alibaba, ByteDance, Tencent và Baidu của Trung Quốc, mà cả với các startup AI từ Mỹ, Trung Quốc và Châu Âu. Sự cạnh tranh đang khiến các sản phẩm liên quan đến AI ngày càng mạnh và rẻ hơn, ít ảo giác hơn (bảng 1 và 2).

Khảo sát đầu năm 2025 của nhóm nhà nghiên cứu ngôn ngữ học tính toán tại Đại học Munich (Đức), phát hiện tỉ lệ “ảo giác” trong sử dụng thực tế của Top20 mô hình LLM ở 30 ngôn ngữ đạt trung bình từ 7% đến 12%. Tỉ lệ “ảo giác” của các mô hình AI tiên tiến nhất hiện nay ở ngôn ngữ phổ biến đã cải thiện đáng kể (bảng 1 và bảng 2), nhưng sẽ tăng vọt lên mức 5% - 15% khi chuyển sang các ngôn ngữ hiếm, ít hỗ trợ hoặc yêu cầu phản hồi cực dài.

Ứng dụng AI đang chuyển dịch rất nhanh từ các chatbot mang tính phỏng đoán sang tác nhân AI (agentic) và AI vật lý (robotic) có khả năng tạo ra kết quả ổn định, tin cậy và bảo mật hơn, được triển khai ngày càng sâu rộng khắp các ứng dụng và dịch vụ, từ cho cộng đồng, doanh nghiệp đến giới học thuật và các chính phủ.
Ví dụ, hệ thống AI AlphaFold do Google DeepMind xây dựng và ra mắt năm 2020 (đã nhận giải VinFuture 2022 và giải Nobel 2024), nhận biết chính xác về cấu trúc 3D của 170.000 protein, được tăng lên 200.000 protein vào năm 2022, từ đó đưa ra phân tích chức năng protein dựa trên hình ảnh cấu trúc 3D, mở đường cho các nghiên cứu đột phá trong lĩnh vực sinh học. Việc sử dụng thuật toán Smith-Waterman được tối ưu hóa với GPU H100 cho phép căn chỉnh, phân loại và sắp xếp ADN và protein nhanh hơn 40 lần so với sử dụng CPU và 7 lần khi dùng GPU V100, giúp AlphaFold-2 công bố năm 2024 nhận biết được cấu trúc của tất cả 200 triệu protein đã phát hiện trên Trái đất với độ chính xác ở mức nguyên tử.
Đặc biệt các AI tiên tiến phát hành năm 2025-2026 cho phép tinh chỉnh với dữ liệu riêng, tạo ra những chatbot và các agentic chuyên dụng với hiệu suất nâng cao, giúp tăng vượt bậc năng suất và chất lượng trong quy trình công việc ở khắp các lĩnh vực, tạo ra rất nhiều cơ hội để các doanh nghiệp đổi mới, phát triển và duy trì tính cạnh tranh. Các chatbot, agenti và robotic được huấn luyện với dữ liệu riêng có thể giúp doanh nghiệp tiếp cận thị trường mới, cải thiện dịch vụ khách hàng, một số trường hợp giúp tạo ra sản phẩm mới và nguồn doanh thu mới. UNCTAD dự báo, khoảng 30% nhiệm vụ tại văn phòng sẽ được tự động hóa bởi AI vào năm 2028. Còn theo Gartner, đến năm 2028, AI có thể xử lý và đưa ra quyết định hoàn toàn tự động trong khoảng 15% công việc hàng ngày.
Những chatbot và các agentic chuyên dụng đang được các doanh nghiệp tăng sử dụng để tự động hóa các tác vụ trong quy trình công việc, nhất là các bigtech. Ví dụ, Microsoft đã viết khoảng 30% code năm 2025 bằng agentic GitHub Copilot; kỹ sư NVIDIA tăng mạnh sử dụng công cụ viết code Cursor từ năm 2025... Những agentic và robotic được tạo ra ngày càng mạnh, đưa AI trở thành trợ lý thực sự, giúp tự động thực hiện các tác vụ. Chẳng hạn:
i) Nhận đặt chỗ nhà hàng/ khách sạn, đặt vé xem phim/ vé nhà hát/ chuyến bay, thay vì chỉ đưa ra gợi ý, như ứng dụng AWS Agents for Bedrock ra mắt 7/2023. Thực hiện đồng thời đến 10 tác vụ web phức tạp như tìm kiếm và so sánh sản phẩm và thực hiện mua sắm trực tuyến, đặt chuyến du lịch, có agentic Google Mariner hoạt động với mô hình AI Gemini 2.5 Pro từ 5/2025, cập nhật Gemini 3.0 Flash vào 12/2025, Gemini 3.1 Flash vào 3/2026. Hay agentic OpenAI Operator hoạt động với GPT-o3/ GPT-4o từ 5/2025;...
Hay trợ lý lời nói OpenAI Tasks ra mắt 4/2025 hoạt động với mô hình AI GPT-4o, cập nhật GPT-5.2 (12/2025), GPT-5.4 (3/2026), sẽ tự động tìm kiếm thông tin cụ thể, phân tích vấn đề, tóm tắt dữ liệu, điều hướng trang web và truy cập tài liệu, thông báo kết quả khi hoàn thành nhiệm vụ; thực hiện từ cơ bản đến đặt vé xem phim/ nhà hát, đặt chỗ nhà hàng, hành động định kỳ như tóm tắt tin tức hàng tuần hoặc cập nhật thời tiết hàng ngày theo lời nói.
Còn trợ lý lời nói Google Astra ra mắt 5/2025 hoạt động với Gemini 2.5 Pro, cập nhật Gemini 3.0 Flash vào 12/2025, Gemini 3.1 Flash từ 3/2026, thực hiện phản hồi chính xác hình ảnh, văn bản và lệnh đầu vào với nhiều loại tác vụ trên smartphone và kính VR/AR;...
ii) Tối ưu hóa duyệt web và phân tích dữ liệu để khám phá các chủ đề phức tạp và cung cấp báo cáo toàn diện chuyên sâu, dễ hiểu, gồm cả xử lý dữ liệu riêng, như Google Deep Research vận hành với Gemini 2.5 Pro từ 2/2025, cập nhật Gemini 3.0 Flash vào 12/2025,...
iii) Điều khiển máy tính thay người, như viết và chỉnh sửa tài liệu hoặc code với hiển thị theo thời gian thực, hàng đầu có agentic Google Canvas vận hành với mô hình AI Gemini 2.5 Pro từ 4/2025, cập nhật Gemini 3.0 Pro vào 12/2025, và Gemini 3.1 Pro vào 3/2026. Hay agentic OpenAI Operator hoạt động với với mô hình AI GPT-4o từ 5/2025, cập nhật GPT-5.1 vào 12/2025, và GPT-5.4 vào 3/2026;...
iv) Các agentic được tạo ra từ các nền tảng như OpenClaw và Moltbook phát hành 2/2026, có thể tự đăng bài, tranh luận và kết nối mạng, tự sắp xếp, dọn dẹp, tóm tắt và trả lời email...
v) Đặc biệt loạt công cụ agentic có năng lực viết code ngang con người, như GitHub Copilot X (01/2026), Claude Opus 4.6 Code (02/2026), GPT-5.4 Codex (3/2026),… đạt tốc độ từ hơn 500 đến 1000 token/giây, cho phép tự động lập trình thời gian thực, đang làm thay đổi sâu sắc ngành viết code, tạo ra bước ngoặt lĩnh vực phần mềm. Nhất là các nền tảng agentic tiên tiến hơn vận hành với bảo mật, như NVIDIA NemoClaw ra mắt 3/2026, giúp các doanh nghiệp các ngành nghề dễ dàng tạo ra và ứng dụng an toàn các agentic.
Các "làn sóng chiến lược" mà các công ty công nghệ và các quốc gia hướng đến, cùng nguồn lực và tài nguyên dồi dào cho AI, thúc đẩy AI thay đổi rất nhanh, chuyển từ tác nhân AI năm 2025 sang AI vật lý từ năm 2026, sẽ tiến tới siêu trí tuệ (AGI) vào năm 2030.
Trong đó, mô hình AI là cốt lõi và quyết định “độ thông minh” và sức mạnh của các ứng dụng AI. Còn các bộ dữ liệu (dataset) trở thành “thức ăn” và “tri thức” của các mô hình AI. Chúng tăng trưởng vượt bậc cả về số lượng và mức độ tiên tiến, (bảng 3). Từ 5/2023 đến 3/2026, số lượng các mô hình AI và bộ dữ liệu trữ trên các nền tảng như Hugging Face, Google Kaggle, CivitAI, AWS JumpStart … tăng trưởng 15 lần, tăng 1,8 - 3,7 lần mỗi năm.

Hiện nay (3/2026) đang nổi lên cuộc đua điều hướng và tương tác trong thế giới thực với mô hình AI tiên tiến hơn như đa tác tử, AI hiện thân, tiềm năng nhất là mô hình thế giới (World Model), được dẫn dắt bởi một số bigtech như Google (DeepMind và Waymo) với dòng mô hình RT-2 (Robotics Transformer 2); NVIDIA sở hữu nền tảng Isaac và mô hình GR00T dành riêng cho robot hình người; Amazon Robotics với các robot logistic nổi tiếng; và một số startup kỳ lân đột phá như Physical Intelligence, World Labs. Họ phát triển hệ thống điều hướng thế giới vật lý bằng việc huấn luyện cả từ video, dữ liệu máy, cảm biến, quỹ đạo chuyển động, và các tương tác vật lý thay vì chỉ từ ngôn ngữ và hình ảnh.
Tuy nhiên, chỉ số lượng ít hơn nhiều mô hình được đánh giá, chấm điểm và xếp hạng uy tín toàn cầu như trên LMArena. Trung bình Top 3 mô hình AI tốt nhất thay đổi ngôi vị trong 3 đến 5 tháng, (bảng 4). Chatbot Arena do nhóm nghiên cứu tại SkyLab và LMSYS, Đại học California và Berkeley phát triển, trở thành một công cụ đo điểm chuẩn quan trọng cho các nhà nghiên cứu và nhà phát triển AI (LMArena.ai/leaderboard), cung cấp cái nhìn tổng quan toàn diện về khả năng và hiệu suất của các mô hình AI được sử dụng trong thực tế trên nhiều mặt với bộ hơn 14.000 câu hỏi trắc nghiệm thuộc 57-60 chủ đề, (bảng 5).

Tuy vậy, những AI đến 3/2026 vẫn hạn chế ở khả năng tự học những thứ mới và “thích nghi” với vấn đề phức tạp, nhất là thích ứng theo ngữ cảnh thời gian thực. Những yếu tố như trách nhiệm, độ an tâm và tính xác thực của thông tin, thì AI tiên tiến nhất như Claude Opus 4.6, Gemini 3.1 Pro, GPT-5.4 High hay Grok 4.2 vẫn hoàn toàn không làm được.

Siêu trí tuệ AGI (Artificial General Intelligence) được biết đến: hiểu thế giới vật chất, không chỉ từ văn bản và ngôn ngữ mà là thế giới thực, có một mức độ hiểu biết thông thường nhất định, có khả năng suy luận và lập kế hoạch, nhớ dai, và khả năng học nhanh nhiệm vụ mới, được dự báo ra đời vào khoảng 2029-2030, kỳ vọng giúp giải quyết vấn đề AI còn hạn chế.
Việc này yêu cầu lượng dữ liệu và sức mạnh điện toán khổng lồ. Đó là thách thức kỹ thuật và tài chính lớn đang được giải quyết với giải pháp cụm gigawatt các data center, siêu máy tính AI kết nối với nhau, và có thể sử dụng đến cả máy tính lượng tử.
Hà Nội, ngày 25 tháng 03 năm 2026.
Nguyễn Quang Chung
