Những thành tựu nổi bật và xu hướng công nghệ trí tuệ nhân tạo
Cập nhật vào: Thứ năm - 21/07/2022 15:39 Cỡ chữ
Trong những năm gần đây, một số cột mốc quan trọng đã được ghi nhận trong sự phát triển của trí tuệ nhân tạo (AI), đã giúp phổ biến rộng rãi các giải pháp AI để tự động hóa các tác vụ do con người thực hiện ở một cấp độ mới về chất lượng. Hầu hết chúng đều liên quan đến sự tăng trưởng của hiệu suất phần cứng và việc đạt được các kết quả ứng dụng đáng kể trong lĩnh vực AI. Một số được trình bày dưới đây:
Deepfake: sự kết hợp của deep learning (học sâu) và fake (giả mạo). Dù mới phát triển vài năm gần đây, nhưng công nghệ deepfake đã trở nên ngày càng phổ biến, có thể gây ra những tác hại khôn lường đến đời sống xã hội. Những video giả, được tạo ra nhờ công nghệ deepfake nhằm mục đích phát tán thông tin sai lệch, gây hoang mang cho cộng đồng hoặc chỉ đơn thuần vì mục đích giải trí. Hiện nay, công nghệ này đang được ngành điện ảnh tích cực ứng dụng. Đồng thời, hướng ngược lại, các nhà nghiên cứu đang đưa ra các giải pháp phát hiện và chống Deepfake (AntiDeepFake), ví dụ, Phòng thí nghiệm An ninh mạng của PJSC Sberbank đã phát triển một công nghệ dựa trên AI để phát hiện tự động DeepFake với độ chính xác lên đến 98%.
Robot Dactyl của công ty OpenAI và robot nhảy múa của công ty Boston Dynamics: năm 2019, công ty R&D AI - OpenAI - đã tạo ra robot Dactyl, có thể học được cách để xử lý và xếp khối rubik chỉ bằng một tay. OpenAI xem đây là một kỳ tích và là một bước nhảy vọt cả về sự khéo léo của robot và khả năng xử lý của hệ thống AI trên robot, các nhà khoa học đã cho Dactyl học các nhiệm vụ mới bằng cách sử dụng mô phỏng ảo trước khi vượt qua thử thách bằng khối rubik thực sự. Do đó, khả năng của robot được đào tạo hoàn toàn dựa trên dữ liệu tổng hợp để tương tác với các vật thể trong thế giới thực đã được chứng minh. Một sự kiện mang tính bước ngoặt khác là việc Hyundai mua 80% cổ phần của công ty Boston Dynamics, nổi tiếng với các robot nhảy múa, có kế hoạch tạo ra các phương tiện cá nhân cho các địa hình khó khăn, đánh dấu một giai đoạn mới trong sự phát triển của thị trường robot dành cho cá nhân.
AlphaFold 2: năm 2020, công ty DeepMind thông báo rằng thuật toán mà họ tạo ra đã thực hiện được nhiệm vụ mà các nhà sinh vật học đã cố gắng giải quyết trong nửa thế kỷ - đó là tìm hiểu cách dự đoán cấu trúc không gian của protein từ thành phần hóa học của chúng và do đó có thể dự đoán hoạt động sinh học của chúng. Thuật toán được “đào tạo” dựa trên dữ liệu có sẵn công khai từ 170.000 protein có cấu trúc đã biết. Các nhà nghiên cứu đã sử dụng khoảng 128 lõi TPUv3 (tương đương với 100-200 GPU). Một trong những kết quả là dự đoán một số cấu trúc chưa từng được biết đến trước đây của virus SARS-CoV-2 (các protein ORF3a, ORF8).
GPT-3: ngày 28 tháng 5 năm 2020, một nhóm các nhà nghiên cứu từ OpenAI đã xuất bản một bài báo mô tả thuật toán xử lý ngôn ngữ tự nhiên tiên tiến nhất (GPT-3). Với khả năng xử lý 175 tỷ tham số so với 1,5 tỷ của GPT-2, GPT-3 thông minh hơn và có khả năng tạo ra văn bản không khác gì con người. Nó có thể được sử dụng để giải quyết phần lớn các vấn đề xây dựng văn bản bằng tiếng Anh. Khi đưa vào GPT-3 bất cứ tham số rời rạc nào, nó cũng sẽ tạo ra một văn bản hoàn thiện, phù hợp nhất với những gì đưa ra. GPT-3 có thể tạo ra các tin tức mà chúng ta không thể phân biệt được là do con người viết hay máy móc tạo ra. Bên cạnh nguy cơ bị lợi dụng cho mục đích xấu, GPT-3 cũng khiến nhiều người lo sợ khi nó có thể lấy mất việc làm của nhiều người, đặc biệt là người viết kịch bản, các biên tập viên báo chí, nhân viên dịch thuật... Ngoài ra, các nhà phát triển AI còn thấy một số ứng dụng đáng ngạc nhiên của GPT-3. Microsoft hiện giữ giấy phép thương mại độc quyền cho GPT-3.
DALL-E của OpenAI: năm 2021, một trong những thành tựu quan trọng là việc tạo ra công nghệ tạo hình ảnh từ mô tả văn bản. Được phát triển bởi OpenAI, mạng nơ-ron DALL-E cho phép tạo hình ảnh chất lượng cao về các đối tượng trừu tượng và không tồn tại bằng cách kết hợp các đặc điểm không liên quan và áp dụng chúng vào các hình ảnh hiện có. Hình ảnh trực quan được tạo bằng mạng nơ-ron dựa trên thuật toán GPT-3. Mô hình AI này đã được huấn luyện dựa trên 650 triệu hình ảnh và chú thích văn bản. DALL-E 2 có thể thể kết hợp các khái niệm, thuộc tính và phong cách khác nhau, chỉnh sửa thực tế đối với hình ảnh người dùng cung cấp. Ngoài ra, hệ thống có thể nhận hình ảnh và tạo ra các phiên bản khác nhau lấy cảm hứng từ ảnh gốc.
Trong tương lai, các hệ thống AI có thể hiểu được những vấn đề phức tạp nhất của khoa học (ví dụ, vấn đề biến đổi khí hậu). Tuy nhiên, để thực hiện các nhiệm vụ quan trọng bằng AI, cần đảm bảo khả năng diễn giải AI, trong đó một người hiểu được toàn bộ quá trình ra quyết định của thuật toán. Điều này sẽ cải thiện độ tin cậy, tính minh bạch, cũng như cải thiện các đặc tính kỹ thuật và sử dụng của các hệ thống AI.
Xu hướng công nghệ
Đến nay, các cuộc thảo luận vẫn tiếp tục trên thế giới về các phương pháp tiếp cận cấu trúc lĩnh vực AI. Thông thường, các lĩnh vực ứng dụng được sử dụng như một dấu hiệu của phân nhóm công nghệ gồm: thị giác máy tính, xử lý ngôn ngữ tự nhiên, nhận dạng và tổng hợp giọng nói, hệ thống khuyến nghị và hệ thống hỗ trợ quyết định. Sự thành công của các giải pháp AI trong các lĩnh vực ứng dụng được thúc đẩy bởi những tiến bộ trong các phương pháp tiên tiến. Đổi lại, các phương pháp tiên tiến và toán học cơ bản lại dựa trên kiến trúc cơ sở tính toán. Cơ sở vật lý cho tất cả các công nghệ AI là cơ sở linh kiện điện tử.
Các công nghệ AI khác nhau đáng kể về mức độ sẵn sàng. Đường cong về sự trưởng thành công nghệ (đường cong công nghệ), được xây dựng bằng cách sử dụng hệ thống khai thác dữ liệu lớn iFORA, phản ánh các giai đoạn phát triển của các nhóm công nghệ AI chính (Hình 4). Các phương pháp AI đầy hứa hẹn, với tư cách là những phương pháp đột phá nhất, thực tế lại ít phổ biến. Do tốc độ thay đổi cao, các công bố khoa học trong lĩnh vực AI đầy hứa hẹn có thể trở nên lỗi thời trong vòng 6 tháng đến 2 năm.
Khi tính đến cường độ nghiên cứu và phát triển, có bốn giai đoạn được phân biệt: Giai đoạn I - sự xuất hiện của công nghệ (hoạt động xuất bản cao); Giai đoạn II - thời kỳ hoàng kim của công nghệ (tăng trưởng về cấp bằng sáng chế và khối lượng phân tích thị trường); Giai đoạn III - sự trưởng thành về công nghệ (ưu thế của phân tích thị trường); Giai đoạn IV - bình nguyên (giảm số lượng công bố xuất bản và bằng sáng chế, không có thay đổi hoặc giảm nhẹ trong phân tích thị trường).
P.A.T (NASATI), theo Artificial Intelligence Index Report 2022