DỊCH CHUYỂN CÔNG NGHỆ AI VÀ XU HƯỚNG THỊ TRƯỜNG

11/15/2023 - 12:00 AM
Có 3 làn sóng AI: Thứ nhất là các hệ AI chuyên gia (trước đây); làn sóng thứ 2 (hiện nay) là AI học máy dựa trên thống kê, tức thu thập dữ liệu, dùng mô hình thống kê và học quy luật từ số đông; làn sóng thứ 3 là AI tương lai, có khả năng giải thích hoặc đưa ra bằng chứng cho đề xuất (AI xác thực).
Ngành AI vừa qua còn ở giai đoạn “thủ công” trong phát triển với các chuyên gia khoa học dữ liệu và kỹ sư phần mềm tự thiết kế các hệ thống AI chỉ dùng cho một vài ứng dụng cụ thể mà chưa được phát triển thành một hệ sinh thái hay chuỗi cung ứng sâu sắclinh hoạt cần thiết cho bất kỳ đổi mới nền tảng nào để mở rộng quy mô. Điều này đòi hỏi những nhà cung cấp đáng tin cậy có đầy đủ các công cụ chuyên dụng để xây dựng và phát triển các AI, đồng thời cung cấp các quy chuẩn tương tác để đảm bảo các công cụ này làm việc cùng nhau một cách liền mạch.
•  Với việc AI trải rộng khắp các lĩnh vực, việc làm mới sẽ được tạo ra trong phát triển, lập trình, thử nghiệm, hỗ trợ và bảo trì. Forrester dự đoán AI, học máy và tự động hóa sẽ tạo ra 9% số việc làm mới của Hoa Kỳ vào năm 2025, các công việc bao gồm chuyên gia giám sát robot, nhà khoa học dữ liệu, chuyên gia tự động hóangười quản lý nội dung, trở thành một xu hướng công nghệ mới.
Để giữ được khả năng cạnh tranh, các doanh nghiệp đang nhận ra giá trị không thể nghi ngờ mà AI mang lại. Tuy nhiên, hầu hết các dự án AI trước năm 2021 vẫn thất bại: khoảng 80% chưa từng triển khai và những dự án đã triển khai thì chỉ mang lại lợi nhuận trong 60% thời gian.
Sự công nghiệp hóa AI đang là một xu hướng chính được xác định từ năm 2020. Chẳng hạn, nhu cầu toàn cầu năm 2020 đối với các dịch vụ Amazon Virtual Assistant tăng lên 778%. Chi tiêu AI toàn cầu năm 2021 đạt hơn 57 tỉ USD, và đến 12/2022 có 56% doanh nghiệp được khảo sát toàn cầu có ứng dụng AI trong hoạt động. Thị trường AI sẽ phát triển thành ngành công nghiệp 190 tỉ USD vào năm 2025, dự báo đạt 13.000 tỉ USD vào năm 2030, lạc quan thì AI có thể bổ sung 16.000 tỉ USD cho kinh tế toàn cầu và 30% nhiệm vụ tại văn phòng sẽ được tự động hóa trong 5 năm tới (đến 2027).
•  Hiện ngành AI bắt đầu được công nghiệp hóa. Chuỗi cung ứng AI đang phát triển nhanh chóng và năm 2021 có thể xem là thời điểm chuyển mình khi phần lớn các dự án AI cuối cùng cũng bắt đầu thành công. Ví dụ, các nền tảng như Amazon SageMaker có thể được sử dụng để xây dựng, đào tạo và triển khai các mô hình AI cho hầu hết các mục đích sử dụng. Các nền tảng khác, như Microsoft Azure AI Platform, kết hợp các trải nghiệm no-code và code first trong một nền tảng khoa học dữ liệu toàn diện. Đây đều là những nỗ lực để hoàn thiện chuỗi cung ứng AI từ các nhà cung cấp cloud, cùng các startup giúp lấp đầy khoảng trống với những ứng dụng AI thường có chức năng tiên tiến hơn.
•  Có nhiều cách để đảm bảo một chuỗi cung ứng và thúc đẩy mở rộng áp dụng AI, chẳng hạn cải thiện việc chia sẻcấp phép cho các doanh nghiệp, như Synthesized sử dụng các công nghệ giống phòng sạch dữ liệu. Hay Tecton.AI và shopworks.AI cung cấp các công cụ và dịch vụ như pipeline khai thác tính năng, cửa hàng tính năng và chia sẻ tính năng. Các startup đang giải quyết nhiều vấn đề khác, như quản lý dữ liệu, xây dựng mô hình, kho dữ liệu, hay “chưng cất” các mô hình đào tạo.
Tuy nhiên, sự cạnh tranh trong không gian AI đang gia tăng với không chỉ các bigtech như Microsoft, Google, Meta, IBM, AWS… mà còn từ các startup như OpenAI, Cohere và Anthropic có nguồn vốn lớn được hỗ trợ. Họ đều đang tăng tốc phát triển và phát hành các sản phẩm AI mới.
Một xu hướng mới nổi của AI là nhiều nền tảng AI tiên tiến như Microsoft DeepSpeed, Google JAX, PyTorch, TensorFlow và XLA, NVIDIA Megatron,… cũng như các LLM với hàng tỉ đến nghìn tỉ tham số như NeMo, Bloom, GPT, PaLM, LlaMA đang phát triển nhanh chóng, cung cấp cơ sở cho các AI tạo sinh có tiềm năng kinh tế đến 4400 tỉ USD, chưa kể tiềm năng chưa nhìn thấy hoặc phát sinh.
•  Một AI tổng quát tiên tiến là nền tảng AI mới IBM Watsonx công bố tại hội nghị Think vào 5/2023, cung cấp các công cụ để xây dựng các mô hình AI. Đồng thời Watsonx được liên kết với hàng nghìn mô hình, bộ dữ liệu và thư viện do startup AI Hugging Face phát triển. Watsonx được cho là có thể sánh ngang với các nền tảng AI thế hệ mới đã cung cấp ra thị trường, như SageMaker Studio của Amazon, Vertex AI của Google, và Azure AI của Microsoft. Tuy nhiên, Watsonx là nền tảng công cụ AI duy nhất cung cấp đến 7 mô hình đào tạo trước phát triển cho doanh nghiệp, trong đó vài mô hình mã nguồn mở, giúp giảm 30-50% các công việc liên quan từ văn phòng cổ điển đến các yếu tố của chuỗi cung ứng, hoạt động CNTT hay các yếu tố của an ninh mạng. Watsonx gồm:
(1) Watsonx.ai là “studio doanh nghiệp dành cho các nhà xây dựng AI” với 3 mô hình nổi bật là (i) Mô hình tạo mã fm.model.code; (ii) Tập hợp các mô hình ngôn ngữ lớn fm.model.NLP; và (iii)  fm.model.geospatial, một mô hình được xây dựng dựa trên dữ liệu khí hậu và viễn thám của NASA.
(2)  Kho lưu trữ dữ liệu Watsonx.data được thiết kế cho khối lượng công việc dữ liệu và AI, cho phép người dùng truy cập dữ liệu thông qua một điểm nhập duy nhất trong khi áp dụng các công cụ truy vấn, cộng với quản trị, tự động hóatích hợp với cơ sở dữ liệu và công cụ hiện có của tổ chức.
(3) Bộ công cụ Watsonx.governance, cung cấp các cơ chế để bảo vệ quyền riêng tư của khách hàng, phát hiện sự sai lệch của mô hình, đồng thời giúp các tổ chức đáp ứng các tiêu chuẩn đạo đức.

Một số mô hình ngôn ngữ lớn (LLM) thương mại hiện nay
  Từ năm 2022 bùng nổ các ứng dụng, công cụ và dịch vụ mới tích hợp AI. Trong đó các công ty công nghệ đang chạy đua để phát triển các AI tạo sinh (Generative AI). Năm 2022-2023 chứng kiến ​​sự gia tăng nhanh chóng của những mô hình AI tạo sinh (Hình 1), mà chìa khóa để phát triển là lấy các mô hình ngôn ngữ lớn (LLM) làm nền tảng như ChatGPT sử dụng GPT3, chatbot Bard dùng PaLM, BlenderBot3 dựa trên OPTBlenderBot4 dựa vào LlaMA,
Những AI tạo sinh như DALL-E có thể tổng hợp những hình ảnh mới lạ; GPT, PaLM, LLaMA có thể tạo ra văn bản, code, ảnh kỹ thuật số, video hoặc giai điệu âm thanh mới theo yêu cầu bằng dòng text ngôn ngữ tự nhiên của người dùng; hoặc OPT và Galactica (11/2022) của Meta có thể hỗ trợ viết bài báo khoa học và giải các bài toán. Ấn tượng là khi đề nghị Bard gợi ý một chuyến du lịch, siêu AI này không chỉ đưa ra kịch bản thông thường mà còn có thể đính kèm những hình ảnh của điểm tham quan. Đây là điều các AI tạo sinh khác chưa giỏi.
•  Trong khi đó, các siêu AI (Frontier AI) được đào tạo với rất nhiều dữ liệu như từ kho dữ liệu phổ biến The Pile, các mạng xã hội, nhật ký truy cập Intenet, và bằng hệ thống HPC-AI mạnh mẽ có hiệu suất đến exaflops hay hệ thống Cloud với hàng nghìn GPU tăng tốc, nhưng rất tốn kém. Chẳng hạn, PaLM ra mắt 4/2022 được đào tạo từ 780 tỉ token với 540 tỉ tham số, tốn 8 triệu USD. PaLM-2 giới thiệu 5/2023 dựa trên 3600 tỉ token với 340 tỉ tham số, ở hơn 100 ngôn ngữ tự nhiên và hơn 20 ngôn ngữ lập trình, từ đó hỗ trợ lập trình, giải toánsáng tạo nội dung mạnh hơn hẳn PaLM, nhưng Google phải chi vài chục triệu USD. Hay Meta tốn 2 triệu USD để đào tạo OPT (5/2022) từ 175 tỉ token, và chi 16 triệu USD cho đào tạo LLaMA (2/2023) từ 1430 tỉ token với 65 tỉ tham số (tương đương Google Chinchilla-70B 2/2022). Hoặc siêu AI ChatGPT nổi danh toàn cầu chính là GPT-3.5 được đào tạo từ 300 tỉ token, tốn hơn 10 triệu USD và có dung lượng 800GB.
Nhất là siêu AI GPT-4 (3/2023) được huấn luyện với 1700 tỉ tham số (chuyên gia trong ngành ước đoán) trong khoảng 1 ngày bởi hệ thống HPC-AI tùy chỉnh mới của Microsoft có hiệu suất AI đến 75 exaflops cung cấp bởi 22.000 GPU H100 và 5500 CPU Xeon Platinum 8480C, tiêu tốn hơn 100 triệu USD (theo CEO OpenAI), chi phí vận hành khoảng 700.000 USD/ngày (chuyên gia trong ngành ước tính) và có thể tăng cao hơn nữa khi số người dùng chatbot này (ChatGPT Plus) tiếp tục gia tăng.
Tuy các siêu AI tạo sinh hiện nay có 4 khả năng cốt lõi: hiểu, sáng tạo, lập luận và ghi nhớ như ChatGPT, chatbot Bard, Meta BlenderBot, hay Baidu Ernie Bot (3/2023), Alibaba Tongyi Qianwen (4/2023), SenseTime SenseChat (4/2023)… Chúng vẫn có khoảng 25 - 40% trường hợp bịa ra nội dung hoặc đưa thông tin độc hại phản hồi theo yêu cầu (prompt) xấu; và có xu hướng xâm phạm quyền dữ liệu. Từ đó nảy sinh nhu cầu kiểm soát AI từ khi xây dựng với "cảnh sát AI" làm nhiệm vụ mã hóa cứng siêu AI trong các logic thực thi của hệ thống bảo vệ, đảm bảo không nói luyên thuyên ngoài chủ đề người dùng đang đề cập hoặc nhắc đến nội dung độc hại.
•  Đã có bước tiến quan trọng trong giải quyết vấn đề này, như NeMo Guardrails - lớp phần mềm nằm giữa người dùng và mô hình LLM hoặc các siêu AI - được NVIDIA công bố vào 25/4/2023, giúp giải quyết vấn đề siêu AI bị "ảo giác". NeMo Guardrails buộc chatbot chỉ nói về một chủ đề cụ thể, loại bỏ nội dung độc hại và hạn chế việc thực thi các lệnh độc hại trên máy tính. Hay cuộc “tập trận lớn” đầu tiên của các red team AI diễn ra 8/2023 bởi 8 công ty AI lớn gồm OpenAI, Google, Meta, Nvidia, Stability AI và Anthropic "mở cửa" mô hình AI để hơn 2.000 hacker tấn công và đã tìm thấy ~2.700 sai sót trong các AI mới nhất, như GPT-4 của OpenAI, hay PaLM-2 của Google, giúp các công ty AI đào tạo các AI tránh được những lỗi này.
•  Vào 9/2023, Liên hợp quốc đã thảo luận đề xuất của EU về quản trị AI. Và Hội nghị thượng đỉnh toàn cầu đầu tiên về AI (1-2/11/2023) tại Bletchley Park, Vương quốc Anh đã ra tuyến bố chung về "an toàn AI" - "Tuyên bố Bletchley", được 28 quốc gia tham dự ký kết, thống nhất về kiểm soát AI. Với Hoa Kỳ, đã ban hành sắc lệnh về AI ngày 30/10/2023, nhằm quản lý những rủi ro từ AI, yêu cầu đặt ra các tiêu chuẩn nghiêm ngặt để thử nghiệm AI trước khi ra mắt. Trung Quốc đã ban hành các biện pháp hành chính tạm thời đối với dịch vụ AI tạo sinh, trong khi chờ một bộ luật chính thức về AI đang xây dựng. Nghị viện châu Âu đã thông qua Đạo luật AI, quy định toàn diện về AI. Nhóm G7 cũng đã nhất trí về một bộ nguyên tắc an toàn AI và quy tắc ứng xử tự nguyện dành cho các nhà phát triển AI...
•  Mặt khác, những mô hình LLM hiện giờ bị hạn chế ở khả năng học những thứ mới và “thích nghi” với những vấn đề phức tạp hay mang tính chiến thuật, bởi chúng phụ thuộc hoàn toàn vào những tham số mẫu để dự đoán những mẩu nội dung hợp lý nhất để trả lời cho một câu lệnh của người dùng. Có thể không có gìthông minh” trong giải pháp LLM hiện tại, đơn giản là vì chúng học cách tạo ra từ các nội dung do chính con người làm ra. Những yếu tố khác như trách nhiệm, độ an tâmtính chính xác của thông tin, những LLM như GPT-4 vẫn hoàn toàn không làm được.
Tuy nhiên, “AI thay đổi rất nhanh, sau giai đoạn phát triển nóng, cơn sốt AI tạo sinh sẽ hạ nhiệt, nhưng chắc chắn sẽ tiếp tục phát triển”, bởi với xu thế nhu cầu cũng như nguồn lựctài nguyên cho AI đang ngày càng dồi dào. Và kết quả của những AI tạo sinh mới đang rất ấn tượng, nên bây giờ (từ 9/2023) là lúc thảo luận về cách áp dụngsử dụng công nghệ này ở vai trò người thực hiện (taker), định hình (shaper) hay nhà sản xuất (maker) trong các ngành, lĩnh vực. Hiện nay các công ty toàn cầu nỗ lực phát triểnsử dụng AI tạo sinh theo cách riêng. Chẳng hạn:
- Google đang thử nghiệm chatbot Gemini (mô hình siêu AI đa phương thức lấy cảm hứng từ AlphaGo) sẽ hoạt động tốt hơn GPT-4 với sức mạnh tăng 5 lần so với PaLM-2, dự kiến ra mắt cuối năm 2023. Gemini được Google đào tạo bằng ít hơn GPU H100, nhưng chi phí có thể tới trăm triệu USD. Ở trung tâm của Gemini là giải pháp thuật toán đào tạo tăng cường (reinforcement learning), cho phép Gemini học cách tiếp cận vấn đề một cách logic và có hệ thống. Gemini còn sử dụng giải pháp thứ hai Tree Search, một phương pháp khám phághi nhớ bước tiếp theo như của Alpha Go. Với Gemini, Google đặt mục tiêu tạo ra một phần mềm AI đàm thoại có khả năng hiểuphản hồi tự nhiên, chính xácsáng tạo cho người dùng, cung cấp thông qua dịch vụ Google Cloud Vertex AI.
- Một loạt dự án đang được phát triển dựa trên GPT-4 với cơ hội lợi nhuận đáng kinh ngạc, như công cụ tạo chatbot tùy chỉnh cho doanh nghiệp. Hay với đầu tư 13 tỷ USD vào OpenAI kể từ 2019, doanh thu của Microsoft từ các tính năng do OpenAI cung cấp có thể đạt 99 tỉ USD vào năm 2027.
Microsoft đang làm: Tích hợp GPT-4 vào chatbot Bing (ra mắt 2/2023); Tích hợp kết hợp các công cụ AI vào các phần mềm quen thuộc, như chatbot Copilots (hợp nhất các trợ lý AI riêng lẻ ở nhiều ứng dụng Windows trên máy tính, phát triển bởi GitHub và OpenAI), đã chính thức đưa vào Window 11, Microsoft 365 và Edge phát hành từ 26/9/2023, giúp người dùng giảm thiểu các tác vụ nhàm chán.
- Mô hình cải tiến GPT-4 Turbo ra mắt 11/2023, được đào tạo từ dữ liệu cập nhật đến 4/2023, còn GPT-4 là đến 6/2022. Theo CEO Altman, GPT-4 Turbo mạnh, nhanhrẻ hơn GPT-4, có thể nhớ tới hàng trăm trang văn bản (so với GPT-4 nhớ được 50 trang), có khả năng phân tích văn bản, hình ảnh.
- Hay tại sự kiện ISC23 (5/2023), Intel đã công bố mô hình AI tạo nội dung Aurora genAI với 1000 tỉ tham số được hướng đến phục vụ cho những nhu cầu nghiên cứu khoa học, tạo ra văn bản, dữ liệu khoa học và những dòng code phục vụ cho quá trình nghiên cứu tìm cách chữa ung thư, giải quyết biến đổi khí hậu, nghiên cứu vũ trụ, phân tích chuỗi protein, nghiên cứu vật liệu mới,…
- Hoặc như Morgan Stanley đang sử dụng AI để hỗ trợ các nhà quản lý tài sản của họ trên toàn cầu thực hiện công việc. Trong lĩnh vực khoa học đời sống, Insilico Medicine đã phát triển một mô hình AI tổng quát để dự đoán tỷ lệ thành công thử nghiệm lâm sàng với độ chính xác hơn 80%, còn AstraZeneca tăng tốc nghiên cứu thuốc bằng cách đào tạo các mô hình AI về hóa sinh và hình ảnh bệnh lý kỹ thuật số để giúp tạo ra các phân tử mới. Trong lĩnh vực phần mềm máy tính, Adobe đã phát triển một bộ công cụ AI tạo sinh để tăng cường sức mạnh cho nền tảng chỉnh sửa ảnh và video…
- Các Bigtech đang tăng tốc phát triển và áp dụng AI, như Apple phát triển LLM Ajax với hơn 200 tỉ tham số, được sử dụng nội bộ trong các công việc của Apple và đang từng bước áp dụng vào các ứng dụng phần mềm. AWS đang rót 4 tỉ USD vào Anthropic để bắt kịp Google và Microsoft. Hay Samsung đang đẩy nhanh việc đưa ra thị trường AI tạo sinh Samsung Gauss đang sử dụng nội bộ.
- Sự cạnh tranh giữa các công ty sẽ khiến sản phẩm liên quan đến AI ngày càng rẻ. "Sớm muộn gì trợ lý AI cũng sẽ xuất hiện trong mọi lĩnh vực, mọi hoạt động của đời sống", nhà sáng lập Microsoft đưa ra nhận định vào 11/2023, và tin rằng mọi người sẽ có trợ lý AI của riêng mình trong 5 năm tới.
•  Mặt khác, không chỉ các công ty cạnh tranh quyết liệt về xây dựngứng dụng AI mà giữa các quốc gia đang có cạnh tranh cỡ “chiến lược” về AI ở các lĩnh vực, bao gồm cả trong an ninh-quốc phòng. Như đến 9/2023, chính phủ Trung Quốc đã chấp thuận phát hành rộng rãi hơn 70 LLM với hơn 1 tỷ tham số để cạnh tranh với các ứng dụng AI của Mỹ - CEO Baidu Robin Li cho biết, Reuters.
Hà Nội, 14/11/2023
Nguyễn Quang Chung
Đăng ký nhận bản tin Register